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AMH . H. 斯 托 克 (James H. Stock》 为 哈佛 大 学 经 济 系 教授 。 他 在 加 州 大 学 伯克利 
分 校 分 别 获得 统计 学 硕士 学 位 和 经 济 学 博士 学 位 。 他 的 研究 领域 有 经 济 计量 方法 、 宏 观 经 
济 预 测 、 货 币 政 策 等 。 除 《 经 济 计量 学 》 人 和 外， 他 还 发 表 、 出 版 了 90 多 篇 论文 和 其 他 
EET 

H W. Rig (Mark W. Watson) 是 美国 普林斯顿 大 学 Woodrow Wilson 学 院 经 济 
学 和 公共 关系 学 教授 ， 也 是 芋 图 经 济 研 究 局 的 一 位 副 故 究 员 。 他 在 加 利 福 尼 亚 大 学 圣地 亚 
哥 分 校 获 博 士 学 位 。 他 的 研究 领域 有 时 间 序 列 经 济 计 量 分 析 、 实 证 宏观 经 济 学 、 宏 观 经 济 
预测 等 。 在 上 上述 学 术 领 域 ， 他 发 表 了 60 多 篇 学 术 论文 ， 曾 担任 美国 几 个 有 影响 的 杂志 的 
编 委 ， 包 括 《 美 国 经 济 评论 》、《 上 应 用 经 济 计量 学 》、《 经 济 计量 学 杂志 》,、 《商业 与 经 济 统 
计 杂 志 》 等 。 在 到 普林斯顿 大 学 工作 前 ， 他 曾 在 哈佛 大 学 和 西北 大 学 任教 。 


译 者 简介 A 





王 庆 石 ， 男 ，1961 年 生 ， 辽 宁 洗 辽阳 县 人 。1983 年 毕业 于 东北 财经 大 学 统计 系 并 获 
得 经 济 学 学 士 学 位 ; 1986 年 获得 东北 财经 大 学 统计 系统 计 专 业经 济 学 硕士 学 位 ; 1993 年 
获得 该 专业 经 济 学 博士 学 位 。 

1989 年 1 月 至 1990 年 2 月 ， 曾 在 联合 国人 口 基金 开罗 人 口 培训 中 心 进修 学 习 人 口 统 
iF: 1999 年 1 月 至 1999 年 12 月 ， 曾 以 高 级 访问 学 者 身份 到 美国 纽约 州立 大 学 布 法 罗 分 校 
管理 学院 进修 金融 统计 。 现 为 东北 财经 大 学 数量 经 济 学 专业 教授 、 博 土生 导师 ， 羔 任国 际 
商学 院 院 长 。 
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我 们 非常 荣幸 也 非常 高 兴 《经济 计量 学 》 被 翻译 成 了 中 文 。 
经 济 计量 学 的 两 个 主要 应 用 , 一 是 研究 一 项 干预 《如 公共 政策 的 变化 ) 的 因果 效应 ， 
二 是 利用 有 限 的 历史 数据 做 出 可 靠 的 经 济 预测 。 这 两 个 挑战 具有 普 这 的 重要 性 。 我 们 希望 
本 书 所 介绍 的 方法 技术 对 中 国学 生 也 会 像 对 我 们 美国 学 生 一 样 很 有 用 处 。 
尽管 本 书 中 的 经 验 、 信 子 反 映 的 是 美国 的 数据 ,但 是 所 强调 的 问题 却 具有 广泛 的 重要 
性 。 例如， 我 们 在 引入 回归 分 析 时 所 使 用 的 主要 应 用 案例 是 降低 初中 班级 规模 对 学 生 学 业 
表现 的 因果 效应 的 估计 。 我 们 所 分 析 的 数据 虽然 来 自 美国 加 利 福 尼 亚 州 ， 但 基本 的 政策 问 
题 ， 即 我 们 如 何 来 改进 青少年 的 教育 质量 ， 是 一 个 跨越 国界 的 问题 。 更 一 般 地 讲 ， 本 书 所 
讲解 的 估计 因果 效应 的 方法 蕊 被 广泛 地 应 用 到 许多 国家 ， 并 成 功 地 解决 了 许多 问题 。 
我 们 想 感 谢 所 有 那些 为 本 书 在 中 国 的 翻译 和 出 版 发 行 做 出 努力 的 人 ， 特 别 是 东北 财经 
大 学 出 版 社 ， 以 及 本 书 的 主要 译 者 一 一 东北 财经 大 学 数量 经 济 系 及 国际 商学 院 的 王 庆 石 
教授 。 





詹姆斯 . H. 斯 托 克 
马克 W. RER 
2004. 8 





对 学 生 和 教师 来 说 ， 经 济 计量 学 是 一 门 充满 乐趣 的 课程 。 现 实 的 经 济 界 、 商 业界 和 政 
府 都 是 非常 复杂 和 繁 乱 的 领域 ， 许 多 新 的 观念 和 问题 需要 和 解答。 例如 ， 对 付 醉 酒 驾车 者 ， 
是 通过 严格 的 法 律 还 是 通过 提高 酒 类 的 税收 来 限制 ;在 股票 市 场 上 ， 是 在 价格 相对 较 低 时 
买 进 从 而 从 中 获 利 ， 还 是 按照 股票 价格 随机 游 动 理论 所 建议 的 ， 只 需 睡 大 觉 ; 我 们 是 通过 
缩小 班级 规模 来 改进 小 学 的 教育 质量 ， 还 是 每 天 给 孩子 们 听 十 分 钟 的 莫扎特 的 音乐 就 可 以 
达到 教育 目的 ; 等 等 。 经 济 计量 学 可 以 帮助 我 们 从 纷 经 复杂 的 问题 中 梳理 出 明确 的 思路 ， 
并 对 定量 性 的 问题 给 出 定量 性 的 答案 。 经 济 计 量 学 打开 了 一 扇 定 量 地 认识 我 们 这 个 纷 经 复 
杂 的 现实 世界 的 窗户 ， 例 如 ， 居 民 、 企 业 和 政府 是 如 何 做 出 决策 的 ， 以 及 他 们 之 间 的 关系 
如 何 。 

本 教材 是 专 为 本 科 层 次 学 生 学 习 经 济 计量 学 所 设计 的 一 门 初级 教材 。 我 们 的 体会 是 ， 
在 本 科 的 初级 课程 中 开设 经 济 计量 学 课程 ， 通 过 一 些 有 趣 案例 的 应 用 激发 学 生 学 习 经 济 理 
论 的 兴趣 ， 同 时 理论 又 可 与 应 用 相 结 合 。 这 一 简单 的 原理 代表 了 与 其 他 一 些 旧 版 经 济 计量 
学 教材 中 观点 的 显著 差别 ， 传 统 的 经 济 计 量 学 教材 中 的 理论 模型 或 理论 假设 与 实际 都 是 不 
相符 的 。 一 些 学 生 在 花费 大 量 的 时 间 学 习 经 济 计 量 学 的 模型 或 假设 后 ， 在 实践 中 却 意 识 到 
这 些 模型 和 假设 是 不 切合 实际 的 ， 这 也 不 是 为 奇 ， 所 以 当 应 用 与 假设 不 一 致 时 他 们 只 好 重 
新 寻求 解决 问题 的 方案 。 我 们 相信 ， 通 过 具体 的 应 用 ， 然 后 再 提供 一 些 简单 的 与 应 用 相符 
的 假设 .用 这 种 方式 来 激发 学 生 学 习 理 论 工 具 会 取得 更 好 的 效果 。 因 为 理论 的 意义 立 基 在 
应 用 中 显现 出 来 了 ， 所 以 ， 这 种 方法 使 经 济 计生 学 变 成 一 门 活 生生 的 课程 。 


本 书 的 特点 - 


本 教材 与 其 他 同类 教材 相 比 ， 主 要 在 三 个 方面 有 所 不 同 。 第 一 ， 我 们 把 现实 世界 中 的 
问题 、 数 据 与 理论 的 导出 结合 在 一 起 进行 讲解 ， 而 且 我 们 特别 重视 实证 分 析 所 取得 的 重要 
结论 ; 第 二 ， 我 们 对 案例 的 选择 反映 了 现代 的 理论 与 实践 ; 第 三 ， 我 们 提供 的 理论 和 假设 
与 应 用 是 相符 的 。 我 们 的 目的 是 教会 学 生成 为 经 济 计量 学 熟练 的 使 用 者 ， 而 且 恰 当 应 用 本 
初级 教材 所 要 求 掌握 的 数学 工具 。 


现实 世界 的 问题 与 数据 
在 本 教材 中 ， 一 些 重要 的 现实 问题 往往 都 需要 确切 的 数量 答案 ， 我 们 就 是 围绕 这 样 的 < 
问题 来 选择 每 一 个 方法 论题 材 的 。 例 如 ， 我 们 在 讲授 一 元 回归 、 多 元 回归 和 函数 形式 分 析 ° 
时 ,是 以 “估计 学 校 的 投入 对 学 校 产 出 的 影响 ”( 例如 在 小 学 ， 人数 少 的 小 型 班 是 否 比 人 
数 多 的 大 型 班 考试 分 数 更 高 ) 这 一 案例 题材 进行 讲解 的 。 我 们 在 讲解 面板 数据 时 是 通过 
分 析 “ 评 酒 驾 车 法 对 交通 死亡 率 的 影响 ”这 一 案例 来 完成 的 。 在 讲授 二 元 因 变 量 回 归 








(logit 和 probit 模型 ) 时， 我 们 是 采用 “市 场 土家 庭 消费 贷款 中 是 省 存 在 种 族 歧视 ”这 一 
问题 作为 应 用 案例 分 析 的 ， 在 讲授 工具 变量 佑 计时 ， 我 们 采用 了 “对 香烟 需求 弹性 的 佑 
计 ” 这 -一 现实 案例 。 人 尽管 这 些 例子 都 需要 一 些 经 济 学 的 推理 ， 但 只 要 学 过 初级 的 经 济 学 
就 可 以 懂得 这 些 问 题 ， 许 多 问题 即使 没 学 过 经 济 学 照样 可 以 明 [1。 这 样 ， 老 师 在 课堂 上 就 
可 以 专心 讲授 经 济 计 基 党 这 门 课 ， 而 个 是 补 微观 经 济 学 或 宏观 经 济 学 的 课 ， 

我 们 非常 认真 地 对 待 我 们 每 -个 实证 应 用 的 案例 ， 我 们 不 仅 昌 让 学 生 知道 怎样 从 数据 
中 得 到 信息 ， 而 也 还 要 让 学 生 学 会 自我 分 析 ， 认 识 到 实证 分 析 的 局 限 性 ， 通 过 每 一 个 案例 
的 应 用 ， 我 们 教会 学 生 探寻 其 他 的 分 析 和 解决 办 法 ， 并 评估 其 结果 是 否 稳定 。 在 实证 分 析 
中 所 问 的 问题 都 是 非常 重要 的 ， 我 们 所 提供 的 竺 案 也 是 严肃 的 、 可 信 的 。 但 是 ， 我 们 还 是 
鼓励 学 生 和 孝 师 男 尽 躁 径 ， 用 其 他 的 方法 分 析 案 例 中 的 数据 。 相 关 的 内 容 可 以 在 本 教材 的 
专用 网 站 (www. aw. comystock. watson) 上 查询 。 


关于 教材 的 内 容 

经 济 计量 学 在 过 去 的 二 十 几 年 中 得 到 了 较 快 的 发 展 。 本 教材 中 介绍 的 内 容 反映 了 当代 
应 用 经 济 计量 学 最 新 发 展 中 的 主要 内 容 。 一 个 初级 课程 不 可 能 包罗 万 象 ， 我 们 只 能 集中 于 
讲解 那些 在 实践 中 常用 的 程序 和 检验 ， 例 如 : 

工具 杰 央 同 归 。 在 教材 中 ， 工 具 变量 回归 是 作为 处 理 误 差 项 与 回归 因子 之 间 相 关 的 
一 般 方法 来 介绍 的 ， 其 产生 有 多 种 原因 ,包括 里 立 因果 关系 。 对 一 个 有 效 工 具 变量 的 两 个 
假设 一 -外 生性 和 相关 性 一 一 我 们 给 予 了 相同 的 重视 。 接 普 我 们 展 季 了 讨论 ， 工 具 变量 从 
哪里 来 ， 过 度 识 别 约 束 的 检验 和 弱 工 具 变量 的 诊断 ， 我 们 还 阐释 了 如 果 这 些 诊断 指出 了 问 
题 该 皇 么 办 。 

项目 评 估 。 越 来 越 多 的 经 济 计 量 研究 分 析 随机 控制 试验 和 准 试验 ， 又 称 自然 试验 。 
在 第 11 章 中 ,我 们 研究 了 这 些 问 题 ， 通 常 把 它们 一 起 视 为 项 目 评估 。 我 们 提出 这 种 研究 
策略 是 作为 遗漏 变 基 问题 、 联 立 因 果 关 系 问 题 和 选择 问题 的 奉 代 方法 ， 我 们 还 对 使 用 实验 
数据 和 谁 实验 数据 的 优点 及 缺点 进行 了 比较 和 评论 。 

e 预测。 在 预测 一 章 【 第 12 童 )， 我们 使 用 时 间 序 列 回归 方法 而 不 是 很 大 的 联 立 方 
程 结 构 模型 分 析 了 一 元 回归 AR 和 多 元 回归 的 预测 问题 。 我 们 集中 分 析 了 一 些 莘 
单 而 可 车 的 工具 ， 如 自 回 归 及 借助 信息 准则 的 模型 选择 问题 ， 这 些 方法 和 工具 在 实践 中 都 
很 有 效 。 本 章 还 特别 介绍 了 在 实践 中 如 何 处 理 随 本 趋势 (单位 根 》、 单 位 根 失 验 、 结 构 突 
变 检验 【在 已 知 的 和 未 知 的 日 期 )、 伪 样本 外 预测 的 内 容 ， 这 些 内 容 均 在 如 何 建立 平稳 和 
可 靠 的 叶 间 序 列 预 测 模型 问题 中 给 予 了 论述 。 

e 时 间 序 列 辐 妇 。 我 们 明确 区 分 了 时 间 序 列 回 归 的 两 种 不 同 应 用 ， 预 测 和 动态 因 反 效 
应 估计 。 在 使 用 时 间 序 列 数据 进行 因果 推断 的 一 章 “第 13 章 ) ， 对 不 同 的 估计 方法 《 包 
括 普 通 最 小 二 乘法 ) 何 时 会 导致 有 效 的 因果 推断 、 何 时 会 导致 无 效 的 因果 推 产 、 何 时 应 
该 采用 带 有 蜡 方 差 和 自 相关 一 致 性 标准 误 的 OLS 法 估计 动态 回归 ， 均 给 予 了 介绍 。 


与 应 用 相符 合 的 理论 

尽管 经 济 计量 分 析 工 具 通 过 实证 性 应 用 可 以 使 学 生产 生 最 好 的 理解 效果 ， 但 是 学 生 仍 
然 需要 学 习 足 够 的 经 济 计量 理论 ， 以 理解 这 些 方法 和 工具 的 优势 与 局 碌 性 。 我 们 提供 了 一 
种 现代 的 处 理 方法 ， 使 理论 和 应 用 紧密 结合 ， 其 涉及 的 数学 知识 仅 限于 高 等 代数 。 

现代 的 实证 应 用 分 析 拥 有 一 些 共同 的 特征 ， 数据 集 一 般 都 较 大 (上 百 个 甚至 更 多 的 











观测 数据 ); 回归 因子 在 重复 样本 中 是 不 固定 的 ， 其 至 可 能 是 通过 随机 方式 抽 选 的 (或 者 
是 其 他 的 某 种 随机 的 方法 } ; 数据 通常 不 服从 正 态 分 布 ; 没有 先 验 的 理由 认为 误差 项 是 同 
方差 的 【尽管 经 常 有 理由 认为 误差 项 是 异 方差 的 ) 。 

上 述 特 征 使 本 教材 与 其 他 教材 在 对 理论 的 建立 和 导出 方式 上 有 重要 的 差别 。 

s 大 样 洒 力 法 。 因 为 数据 集 道 常 较 大 ， 所 以 ， 从 一 开始 我 们 就 使 用 大 样本 正 态 允 近 作 
为 假设 检验 和 置信 区 间 估 计 中 抽样 分 布 的 依据 。 我 们 的 体会 是 ， 讲 授 大 样本 通 近 的 原理 花 
费 的 时 间 比 讲授 学 生 上 分 步 、 精 确 的 上 分 步 ， 自由 度 的 纠正 等 内 容 花 费 的 时 间 要 少 。 大 样 
本 方法 也 有 助 秆 减少 学 生 在 理解 他 们 所 学 的 精确 的 分 布 理 论 并 不 十 分 重要 (由 于 非 正 态 
RAT) 这 一 和 疝 题 上 的 内 惑 。 在 讲解 样本 均值 内 容 时 ,假设 检验 和 置信 区 间 估 计 中 所 应 
用 的 大 样本 法 ， 可 直接 洛 续 到 多 元 回归 分 析 、logit 和 probit 分 析 、 工 具 变 量 估 计 和 时 间 序 
列 方 法 中 。 

e 随机 挫 样 。 因 为 在 经 济 计量 应 用 中 回归 因子 很 少 是 事先 确定 下 来 的 ， 所 以 ， 我 们 从 
一 开始 处 理 各 种 变量 (内 变量 和 自 变 量 ) 的 数据 ， 就 把 它们 看 做 是 随机 抽样 的 结果 。 这 
个 假定 与 横 截 面 数据 最 初 的 应 用 是 啊 合 的 ， 当 然 也 同样 适用 于 商 板 数据 和 时 间 序 列 数据 。 
由 于 采用 了 大 样本 法 ， 就 不 会 有 其 他 概念 上 和 数学 上 的 困难 。 

* 导 方 关 。 应 用 经 济 计 量 学 家 经 常 使 用 异 方差 稳健 的 标准 误 来 消除 关于 是 否 存在 异 方 
差 的 顾 虚 。 在 本 书 中， 我 们 不 是 把 异 方差 作为 一 个 待 解决 的 问题 或 例外 问题 来 对 符 ， 相 
反 ， 从 一 开始 我 们 就 允许 异 方差 的 存在 ， 并 直接 使 用 异 方差 稳健 的 标准 误 。 我 们 把 同方 善 
的 情况 作为 提 殿 OLS 方法 理论 动因 的 一 个 特例 。 


专业 化 的 生产 者 、 成 熟 的 使 用 者 


我 们 希望 使 用 此 书 的 学 生 会 成 为 实证 分 析 方 法 成 熟 的 使 用 者 。 为 了 实现 这 个 目标 ， 他 
们 不 仅 要 学 习 怎 样 使 用 这 些 回归 分 析 的 工具 ， 而 且 还 要 学 会 如 何 评估 他 们 所 面 对 的 实证 分 
析 结 果 的 有 效 性 。 

讲授 如 何 评估 一 项 实证 研究 的 有 效 性 ， 我 们 从 三 人 方面 人 手 。 

首先 ， 在 介绍 完 回归 分 析 的 主要 工具 之 后 ,我们 就 集中 精力 讲解 第 7 章 ， 即 对 一 项 实 
证 研究 内 部 有 效 性 和 外 部 有 效 性 威胁 因素 的 检验 问题 。 这 一 章 讨论 了 数据 问题 和 将 研究 结 
论 蕉 广 到 其 他 环境 中 出 现 的 问题 。 本 章 还 研究 了 回归 分 析 中 可 能 存在 的 威胁 ， 包 括 遗 油 变 
量 问题 ， 函 数 形式 误 定 问题 、 变 量 中 的 误差 问题 、 变 量 选择 问题 及 联 立 性 问题 ， 以 及 在 实 
三 中 如 何 识别 这 些 威胁 的 方法 。 

其 次 ， 我 们 应 用 这 些 方 法 评估 本 书 中 相应 实证 分 析 例 子 的 结果 。 我 们 这 样 做 也 在 考虑 
其 他 的 模型 设 定 方法 ， 同 时 系统 强调 各 种 影响 实证 分 析 有 效 性 的 因素 。 

再 次 ,为 了 成 为 一 名 成 熟 的 使 用 者 ， 学 生 需 要 像 生产 者 一 样 亲自 进行 实验 。 积 极 的 学 
习 要 胜 过 被 动 的 学 习 ， 经 济 计 重 学 是 供 学 生 积极 学 习 的 最 为 理想 的 一 门 课程 。 为 此 ， 本 教 
材 的 网 站 上 提供 了 数据 集 、 分 析 舱 件 和 做 各 种 实证 分 析 练习 的 一 些 建议 。 


关于 对 数学 背景 的 要 求 


我 们 的 目的 是 使 学 生 建 立 一 种 对 现代 回归 分 析 工具 的 成 熟 的 理解 ， 不 管 本 课程 是 在 高 
水 平 的 数学 基础 上 讲授 还 是 在 低 水 平 的 数学 基础 上 讲授 。 本 书 的 第 1 一 4 部 分 【本 部 分 涉 
及 最 主要 的 资料 ) 对 于 具有 初步 微 积分 数学 知识 的 学 生来 说 是 容易 读 懂 的 。 与 其 他 初级 
经 济 计量 学 教材 相 比 ， 第 1 一 4 部 分 中 公式 较 少 .应 用 较 多 ， 当 然 ， 与 数学 类 的 本 科 生 课 








程 相 比 公式 就 更 少 。 过 多 的 公式 并 不 意味 着 是 一 种 更 为 成 熟 的 处 理 方法 。 根 据 我 们 的 经 
验 ， 过 多 的 数学 介绍 并 不 一 定 使 大 多 数学 生理 解 得 更 深信。 

这 就 是 说 ， 不 同 的 学 生 学 习 的 方式 不 同 。 对 于 数学 基础 较 好 的 学 生 ， 通 过 较 多 的 数学 
训练 学 习 成 绩 可 以 得 到 明显 的 提高 。 因 此 第 5 部 分 包含 了 对 经 济 计 拓 学 理论 的 介绍 ， 这 些 
内容 对 数学 背景 较 强 的 学 生来 说 较为 合适 , 我 们 相信 ， 把 第 5 部 分 数学 内 容 的 章节 与 第 
1 一 4 部 分 的 实际 资料 结合 在 一 起 ， 可 作为 高 年 级 本 科 生 或 硕士 研究 生 经 济 计量 学 课程 的 
教材 。 


本 书 的 内 容 与 组 织 ; 


本 教材 分 为 5 部 分 。 本 教材 假定 学 生 已 经 学 过 概率 论 与 统计 学 的 内 容 ， 尽 管 我 们 在 第 
1 章 中 对 概率 和 统计 的 知识 做 了 回顾 。 第 2 部 分 主要 涉及 回归 分 析 的 内 容 。 第 3 部 分 、 第 
4 部 分 和 第 5 部 分 在 第 2 部 分 核心 内 容 的 基础 上 提供 更 深入 一 层 的 讨论 议题 。 


第 1 部 分 


第 1 章 是 经 济 计量 学 导论 ， 强 调 对 定量 性 问题 提供 定量 性 答案 的 重要 性 。 本 章 讨 论 了 
在 统计 研究 中 因果 关系 的 概念 ， 研 究 了 经 济 计量 学 所 面临 的 不 同 的 数据 类 型 。 第 2 章 和 第 
3 章 分 别 是 对 概率 论 和 统计 学 知识 的 复习 ， 这 两 个 章节 是 作为 正常 的 章节 讲授 还 是 作为 参 
考 资 料 ， 取 次 于 学 生 相关 知识 的 背景 。 


第 2 部 分 


第 4 章 介 绍 一 个 回归 因子 的 回归 分 析 和 普通 的 最 小 二 乘法 (OLS 法 )。 在 第 5 章 ， 学 
生 将 学 到 在 应 用 多 元 回归 时 如 何 处 理 遗漏 变量 误差 问题 ， 进 而 分 析 当 其 他 所 有 自 变量 保持 
不 变 时 一 个 自 变量 变化 的 影响 。 在 第 6 章 ， 多 元 回归 分 析 方 法 被 扩展 为 非 线 性 总 体 回 归 李 
数 模型 ， 这 些 模型 的 参数 是 线性 的 ， 这 样 可 以 应 用 OLS 法 进行 估计 。 在 第 7 章 ， 学 生 们 
又 回 过 头 来 学 习 如 何 认识 回归 分 析 的 优点 和 局 限 性 ， 以 及 怎样 应 用 内 部 有 效 性 和 外 部 有 将 
性 的 概念 评估 回归 分 析 的 结果 。 


第 3 部 分 

第 3 部 分 提供 了 回归 分 析 方法 的 一 些 扩展 。 在 第 8 章 ， 学 生 将 学 到 如 何 运 用 面板 数据 
控制 那些 不 随时 间 变 化 面 变化 的 不 可 观测 的 变量 。 第 9 章 介 绍 含有 两 个 因 变量 的 回归 分 析 
问题 。 第 10 章 研究 工具 变量 回归 怎样 用 于 解决 在 误差 项 与 回归 因子 之 间 产 生 相关 性 的 一 
系列 问题 ， 以 及 如 何 导 找 和 评估 有 效 的 工具 变量 。 第 11 章 引领 学 生 进 人 实验 或 准 实验 
(自然 实验 ) 数据 的 分 析 领 域 ， 所 涉及 的 问题 通常 被 称 做 “项 目 评估 ”。 


第 4 部 分 

第 4 部 分 研究 时 间 序列 数据 回归 。 第 12 章 集 中 讲解 预测 方法 ， 并 介绍 了 各 种 用 于 分 
析 时 间 序 列 回归 的 现代 方法 ， 如 单位 根 检 验 和 平稳 性 检验 。 第 13 章 讨 论 了 如 何 利 用 时 间 
序列 数据 估计 因果 关系 。 第 14 章 介绍 了 一 些 更 高 级 的 时 间 序 列 分 析 的 工具 ， 包 括 条 件 异 
方差 模型 。 





第 5 部 分 


第 5 部 分 介绍 经 济 计量 学 理论 。 这 - -部 分 带 有 一 点 附录 性 质 ， 它 补充 了 前 面 几 章 中 省 
略 的 数学 问题 ， 但 它 又 不 仅仅 是 附录 ， 它 委 成 体系 地 介绍 了 线性 回归 模型 中 估计 与 推断 的 
经 济 计 甚 理论。 第 15 章 研究 单个 回归 因子 的 回归 分 析 理 论 ， 解 释 过 程 中 并 没有 用 到 矩阵 
代数 ,尽管 本 章 比 其 他 章节 确实 需要 有 较 高 水 平 的 数学 推导 。 第 16 章 介绍 和 研究 了 算 阵 
形式 的 多 元 回归 模 增 。 
本 书 中 各 章节 的 先后 逻辑 关系 

央 为 不 同 的 教师 喜欢 强调 不 同 的 资料 和 内 容 ， 我 们 写作 本 书 时 也 考虑 到 了 各 种 不 同 的 
教学 需要 。 从 全 书 的 总 体内 容 来 看 ,第 3 部 分 、 第 4 部 分 和 第 5 部 分 是 相对 独立 的 ， 也 就 
是 说 讲授 这 些 内 容 不 需要 首先 讲授 先前 的 章节 。 每 一 章 特定 的 先 修 章节 在 表 1 中 给 出 。 尽 
管 我 们 发 现 本 书 讨论 的 问题 顺序 在 我 们 自己 讲授 课程 时 很 合适 ， 但 如 果 老 师 希 望 按 不 同 的 
顺序 讲解 也 可 以 ， 本 书 在 章节 编写 时 考虑 到 了 这 种 需要 。 




















Rl 第 3 一 5 部 分 每 一 章 的 先 修 章节 
先 修 部 分 或 章节 
第 1 部 分 第 2 部 分 81,8.2 101,02 12i—124 125—128 1 15 
8 " E 
9 C = 
10.1, 10.2 = E 
10, 3—10. 6 m" iG m = 
ll C = m = 
12 E E 
13 C = E 
14 m E m C m 
15 s E 
16 E B m 








注 : 本 表 给 出 了 讲解 各 章 内 容 最 低 的 先 修 章 节 。 例 如 ， 在 动态 因果 效应 的 估计 一 章 {第 13 章 }, 首 
先 要 求 讲解 第 部 分 (取决 于 学 生 的 准备 情况 ) 、 第 2 部 分 和 第 12 章 的 第 1 一 4 节 。 


[本 书 的 多 种 用 途 ] 
使 用 本 书 ， 可 以 讲解 若干 门 课 程 。 
标准 的 入 门 经 济 计量 学 


这 门 课程 介绍 经 济 计量 学 的 一 些 基 础 知识 (第 1 章 )， 如 果 需 要 的 话 ， 述 可 以 复习 概 
率 论 和 统计 学 的 知识 (第 2 章 和 第 3 章 ) ， 然 后 进入 一 元 回归 分 析 、 多 元 回归 分 析 、 函 数 
形式 分 析 基 础 和 回归 研究 的 评 佑 〈 第 2 部 分 的 所 有 内 容 ) 。 这 门 课程 还 要 涉及 面板 数据 的 
回归 分 析 (第 8 章 )、 含 有 受 限 因 变量 的 回归 分 析 (第 9 章 )， 如 果 时 间 允 许 的 话 ， 还 可 











p. 


HELHET (2510 章 ) 。 这 门 课程 以 第 11 章 中 的 实验 和 准 实验 作为 结束 ， 并 
里 新 归纳 学 期 一 开始 提出 的 因 采 效应 的 估计 间 题 ， 概 述 和 总 结 回归 分 析 的 主要 方法 。 先 收 
课程 有 代数 和 基础 统计 和 学， 
带 有 时 间 序 列 分 析 和 预测 应 用 内 容 的 人 门 经 济 计 基 学 

与 标准 的 人 门 经 济 计量 学 相似 ， 这 门 课程 的 内 容 覆 盖 第 1 部 分 (如果 需要 的 话 ) 和 
第 2 部 分 的 全 部 内 容 , 这 门 谍 程 还 可 以 提供 对 面板 数据 的 简要 介绍 (第 8. 1 节 和 第 8. 2 
节 ) ， 并 讲解 工具 变 其 回归 【第 10 章 ， 或 只 讲解 第 10.1 和 第 10.2 节 ) ， 不 过 这 些 是 选择 
性 内 容 。 然 后， 该 课程 应 该 讲授 本 书 第 4 部 分 中 右 关 预测 的 内 容 (第 12 章 } 和 动态 因果 
效应 估计 的 内 容 (第 13 章 ) 。 如 果 时 间 人 允许 ， 该 课程 还 可 以 涉及 一 些 党组 的 时 间 序 列 分 
板 的 内 容 ， 如 条 件 界 方差 【第 15. 5 告 ) 。 先 修 课 程 有 代数 和 基础 统计 学 。 


应 用 时 间 序 列 分 析 与 预测 


林 书 也 可 以 用 做 “应 用 时 间 序 列 分 桥 与 预测 ”课程 的 短期 课程 教材 ， 其 中 回归 分 析 
是 要 求 的 先 修 课程 。 第 2 部 分 的 回归 分 析 工具 也 要 讲授 一 部 分 ， 取 决 于 学 生 的 知识 准备 情 
况 。 然 后 ， 该 课程 的 内 容 就 可 以 直接 转 至 第 4 部 分 ， 从 预测 (第 12 章 ) 、 动 态 因果 效应 
的 估计 (第 13 章 ) 到 时间 序列 分 析 的 高 级 议题 (第 14 章 ) ， 包 括 向 量 自 回归 和 条 件 疆 广 
卷 。 这 门 课程 一 个 非常 重要 的 部 分 是 学 生 亲 手 敌 预测 作业 ， 这 些 作 业 可 在 本 书 的 专门 网 站 
上 得 到 。 先 收 课程 有 代数 和 基础 经 济 计量 学 或 同类 课程 。 
经 济 计量 学 理论 入 门 

本 书 也 适合 于 用 做 具有 较 好 数学 基础 的 高 年 级 本 科 生 的 经 济 计量 学 理论 的 教材 ， 或 者 
用 做 硕士 研究 生 的 经 济 计量 学 教材 。 如 果 有 必要 ， 该 课程 可 以 先 复习 概率 论 和 统计 学 的 理 
论 (第 1 部 分 ) 。 该 课程 可 以 采用 非 数 学 的 方式 即 以 应 用 为 基础 的 方式 介绍 回归 分 析 《 第 
2 部 分 ) ， 接 着 应 该 介绍 经 济 计量 学 的 理论 ， 即 第 15 章 和 第 16 章 ， 然 后 再 讲解 带 有 受 腿 
因 变 其 的 回归 分 析 (259 章 ) 和 极 大 似 然 估计 法 (附录 9.2)， 最 后 应 转 人 讲解 工具 变量 
回归 分 析 (第 10 竟 ) 、 时 间 序 列 分 析 (第 12 章 ) ， 以 及 应 用 时 间 序 殉 数 据 和 普通 最 小 二 
乘法 《第 13 章 和 第 16.6 节 ) 讲解 因果 效应 估计 ， 当 然 最 后 这 部 分 内 容 可 选 可 不 选 。 先 
修 课程 有 微 积分 和 基础 统计 学 。 第 16 章 还 要 求学 生 具有 一 定 的 第 阵 代数 的 知识 。 








教学 方法 上 的 安排 | 


本 教材 在 教学 方法 上 具有 多 样 化 的 特点 ， 意 在 帮助 学 生理 解 、 掌 握 和 应 用 经 济 计 量 学 
中 的 核心 概念 。“ 章 节 介 绍 ”部 分 提供 了 一 个 符合 现实 的 介绍 和 我 们 编排 的 动因 ， 还 给 出 
了 描绘 各 章 讨论 内 容 的 路 径 图 。“ 关 键 性 词汇 ”以 清晰 的 结构 定义 了 各 章 的 主要 词汇 。 在 
周 定 间距 和 的 “重要 概念 ” 框 中 簿 遍地 归纳 了 一 些 重要 的 概念 。" 一 般 兴 趣 ” 框 则 对 相关 话 
匡 和 一 些 现 实 中 运用 所 讲 概念 和 方法 所 做 的 研究 成 朵 提供 了 一 些 有 趣 的 讨论 。" 总 结 ” 部 
分 则 对 复习 每 一 章 主 要 内 容 的 要 点 是 很 有 玫 助 的 。 在 “复习 概念 ”部 分 所 提出 的 问题 ， 
是 检查 学 生 对 所 学 核心 内 容 的 理解 能 力 ,“ 练 习 ” 部 分 则 给 出 了 一 些 运用 本 章 介绍 的 概念 
和 技术 解决 实际 问题 的 练习 十。 在 教材 的 最 后 , “参考 文 献 ”部 分 列 出 了 供 进一步 阅读 的 
资料 ,“ 附 录 ” 则 提供 了 统计 表 , “术语 表 ” (词汇 ) 简洁 地 定义 了 本 书 中 出 现 的 所 有 关 


键 性 术语 。 
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第 | = 
经 济 问题 与 数据 -一 


如 果 问 六 个 经 济 计量 学 家 这 样 的 问题 ;什么 是 经 济 计量 学 ? 你 可 能 会 得 到 六 个 不 同 的 
答案 。 第 一 个 人 可 能 会 告诉 你 经 济 计量 学 是 一 门 检验 经 济 理论 的 学 科 ; 第 二 个 人 可 能 会 告 
诉 你 经 济 计量 学 是 用 来 预测 诸如 公司 的 销售 额 、 经 济 的 总 体 增长 率 或 股票 价格 等 经 济 变 量 
未 来 值 的 一 整套 工具 ;第 三 个 人 可 能 会 说 经 济 计量 学 是 用 数理 经 济 模型 拟 合 现实 进 界 经 济 
教 据 的 过 程 ;第 四 个 人 可 能 会 告诉 你 ,在 政府 和 商业 部 门 ,经 济 计量 学 是 运用 历史 数据 做 出 
数值 化 或 定量 化 政策 建议 的 一 门 艺术 和 科学 。 

实际 上 ,这 些 答案 都 是 正确 的 。 广 义 上 来 说 ,经 济 计量 学 是 一 门 运用 经 济 理 论 和 统计 技 
术 未 分 析 既 济 数据 的 科学 和 艺术 。 经 济 计生 学 方法 在 经 济 学 的 许多 分 支 中 都 有 广泛 的 应 
用 ,包括 金融 学 、 劳 动 经 济 学 .宏观 经 济 学 微观 经 济 学 .市 场 营销 学 和 经 济 政 策 制定 等 。 此 
外 ,经 济 计量 学 方法 在 政治 学 和 社会 学 等 其 他 社会 科学 领域 中 也 有 较 多 的 应 用 。 

未 书 将 向 体 介绍 经 济 计量 学 家 们 常用 的 一 整套 经 济 计量 的 核心 方法 。 我 们 将 运用 这 些 
方法 解答 来 自 商 业界 和 政府 政策 制定 中 各 种 具体 的 和 定量 的 问题 。 本 章 中 列举 了 四 个 此 类 
问题 ,并 用 最 普通 的 术语 探讨 了 解决 这 些 问题 的 经 济 计 量 方 法 。 为 了 回答 这 些 以 及 其 他 的 
定量 性 经 济 问题 ,经 济 计量 专家 需要 取得 数据 ,因此 本 章 以 探讨 各 种 数据 类 型 的 调查 方法 作 
为 本 章 的 结束 。 


[L.1 我们 所 研究 的 经 济 问题 - 


经 济 界 商业 界 和 政府 事 门 中 的 许多 决策 都 依赖 于 我 们 对 身边 世界 中 各 种 变量 之 间 关 
系 的 理解 。 这 些 决策 要 求 对 定量 的 问题 给 出 定量 的 答案 。 

本 书 选择 了 当前 经 济 问题 中 四 个 定量 性 的 经 济 问题 。 这 四 个 问题 涉及 教育 政策 ,抵押 
借贷 的 种 族 歧视 .香烟 消费 和 宏观 经 济 预 测 。 
1.1.1 问题 1: 减 小 班级 规模 会 改进 小 学 的 教育 水 平 吗 


对 美国 公立 教育 系统 改革 的 提议 引发 了 激烈 的 争论 。 许 多 提议 关心 低 年 级 学 生 即 小 学 








1.1.3 问题 3: 香 烟 税 在 减少 香烟 消费 方面 起 多 大 作用 


咀 烟 问题 是 世界 范围 内 关注 的 公共 健康 问题 。 许 多 吸烟 的 成 本 ,比如 因 照 顾 由 吸烟 至 
病 的 患者 所 发 生 的 医疗 费用 ,以 及 圭 些 不 好 量化 的 因 间 接 吸 烟 引致 的 疾病 的 成 本 ,都 是 由 社 
会 其 他 成 员 来 承担 的 。 因 为 这 些 费 用 要 由 社会 大 众 而 不 是 吸烟 者 来 革 担 ,所 以 ,政府 此 时 要 
进行 干预 以 减少 香烟 消费 。 减少 香 类 消费 最 灵活 的 方法 之 一 就 是 提高 香烟 税 。 

经 济 学 基本 原理 认为 ,如 朵 香烟 价格 上 升 ,香烟 消费 就 会 减少 。 但 是 会 威 少 多 少 呢 ? 如 
果 销 售 价格 上 涨 了 1% ,香烟 的 销售 量 会 下 降 百 分 之 多 少 呢 ? 由 价格 增加 1% 所 导致 的 需求 
量变 化 的 百分比 就 是 需求 的 价格 弹性 。 如 果 我 们 要 通过 增加 税收 来 减少 一 定数 晤 的 香烟 消 
费 ,比如 说 20% ,那么 ,我们 需要 知道 价格 弹性 才能 计算 出 为 使 消费 量 下 峰 20 锡 再 要 上 涨 的 
价格 幅度 。 但 香烟 的 需求 价格 弹性 是 多 少 呢 ? 

尽管 经 济 学 理论 为 我 们 提供 了 回答 这 个 问题 的 概念 ,但 它 没有 告诉 我 们 需求 价格 弹性 
的 数值 。 为 了 了 解 这 个 弹性 值 ,我 们 必须 分 析 吸 烟 者 和 洪 在 吸烟 者 的 行为 数据 。 换 名 话说 ， 
我 们 需要 分 析 香 烟 的 消费 数据 和 价格 数据 。 

我 们 分 析 的 数据 是 20 世纪 80 年 代 和 90 年 代 美 国 各 州 的 香烟 销售 量 ,价格 ,税收 和 个 
人 收 人 。 这 些 数 据 表 明 , 具有 低 香 烟 税 进而 香烟 价格 较 低 的 州 的 吸烟 率 高 ,而 有 具有 高 香烟 税 
进而 香烟 价格 较 高 的 州 的 吸烟 率 就 低 。 不 过 ,这 些 数 据 的 分 析 是 复杂 的 ,因为 因果 关系 可 能 
向 两 个 方向 走 : 低 税收 会 导致 高 需求 。 但 是 ,如 果 一 个 州 有 很 多 的 吸烟 者 ,那么 该 州 的 政客 
就 可 能 会 尽力 保持 低 香 烟 税 以 取悦 他 们 的 吸烟 选民 。 在 第 10 章 中 ,我 们 研究 了 处 理 这 种 
“ 联 立 因果 美 系 ”的 经 济 计量 方法 ,并 运用 这 些 方法 估计 了 香烟 需求 的 价格 弹性 。 


1.1.4 问题 4: 明 年 的 通货 膨胀 率 将 会 是 多 少 


人 们 似乎 总 是 私下 里 想 要 对 未 来 进行 预测 。 例 如 ,一 个 正在 考 典 投资 于 新 设备 的 公司 
明年 的 销售 量 会 是 多 少 ” 下 个 月 股票 市 场 会 上 涨 吗 ?如果 会 ,那么 上 涨 多 少 呢 ? 明 年 的 城 
市 税收 入 能 否 够 支付 预算 内 的 城市 服务 费用 呢 ? 下 周 的 宏观 经 济 学 课程 考试 会 集中 在 外 部 
性 问题 上 ,还 是 在 垄断 性 问题 上 ? 这 个 周 六 是 否 是 个 适合 郊游 的 好 天 气 ? 

宏观 经 济 学 家 和 人 金融 经 济 学 家 们 对 未 来 特别 感 兴趣 的 一 个 方面 是 明年 总 体 的 价格 通货 
脱 胀 水 平 。 金 融 专家 可 能 会 建议 客户 在 给 定 的 利率 下 是 贷款 还 是 还 贷 , 取 决 于 她 对 来 年 通 
货 脱 胀 率 的 最 佳 猜测 。 像 在 华 辟 顿 的 联邦 储备 委员 会 .德国 法 兰 克 柱 的 欧洲 中 央 银 行 这 样 
的 中 央 银 行 任职 的 经 济 学 家 们 负 有 维持 价格 通货 膨胀 水 平稳 定 的 责任 ,因此 ,他 们 制定 利率 
的 决策 依赖 于 他 们 对 明年 通货 脱 胀 率 的 展望 。 如 果 他 们 认为 明年 的 通货 膨胀 率 要 上 涨 某 个 
百分点 ,那么 他 们 可 能 会 提高 利率 ,其 提高 的 幅度 比 通货 膨胀 的 幅度 还 要 高 ,以 碱 缓 经 济 这 
热 发 展 带 来 的 风险 。 如 果 他 们 猜测 错误 ,那么 他 们 也 会 骨 风 险 , 即 可 能 导致 经 济 不 必要 的 误 
退 ,或 者 使 通货 膨胀 率 涨 得 点 高 。 

那些 依赖 于 精确 数值 预测 结果 的 专业 经 济 学 家 ,是 用 经 济 计量 模型 做 出 驴 测 的 。 预 测 
者 的 工作 就 是 利用 过 去 来 预测 未 来 ,经 济 计量 学 家 则 是 通过 运用 经 济 理论 和 统计 技术 来 量 
化 历史 数据 之 间 的 关系 进而 对 未 来 做 出 预测 的 。 

我 们 用 来 预测 通货 膨胀 的 数据 是 美国 的 通货 膨胀 率 和 失业 率 。 宏 观 经 济 数据 中 一 个 重 
要 的 经 验 关系 是 著名 的 “菲利普 斯 曲线 ”, 该 曲线 指出 , 当前 的 低 失 业 率 将 伴随 着 米 年 通货 
膨胀 率 的 上 涨 。 在 第 12 章 ,我 们 所 建立 并 进行 评价 的 通货 膨胀 预测 ,其 结果 之 一 就 是 以 菲 
利 普 斯 曲线 为 基础 做 出 的 。 








1.1.5 定量 的 问题 需要 给 出 定量 的 答案 


这 四 个 问题 中 的 每 - -个 都 需要 数值 答案 。 经 济 理论 提供 了 关于 这 些 答 案 的 线索 。 比 
如 ,价格 上 升 时 ,香烟 消费 量 应 该 下 降 ,但 是 确切 的 数值 必须 村 经 过 实证 分 析 才 能 得 到 , 即 分 
析 实 际 数据 。 因 为 我 们 要 用 数据 来 回答 定量 的 问题 ,所 以 ,我 们 的 答案 总 有 一 定 程度 的 不 确 
定性 , 即 不 同 的 数据 集会 产生 不 间 的 数值 答案 。 风 此 ,分 析 的 概念 框架 既 要 提供 所 关心 问题 
的 数值 答案 ,又 要 提供 答案 准确 性 的 测度 。 

本 书 使 用 的 概念 框架 是 多 元 回 妇 模型 ,多 元 回归 模型 是 经 济 计量 学 的 支柱 。 本 书 第 2 
部 分 所 介绍 的 这 种 模型 ,提供 了 一 种 在 保持 其 他 因素 不 变 的 条 件 下 量化 一 个 变量 的 变化 如 
何 影响 为 一 个 变量 的 数学 方法 。 例 如 ,在 保持 学生 特征 (如 家 庭 收 入 ) 不 变 的 条 件 下 (这 些 
特征 学 区 管理 者 无 法 控制 ) , 竹 级 规模 变化 对 考试 成 线 有 什么 影响 9 在 保持 诸如 还 贷 能 力 
等 共 他 因素 不 变 的 条 忻 下 ,申请 人 的 种 族 对 其 获得 住房 抵押 贷款 的 机 会 会 有 什么 影响 ? 在 
保持 吸烟 者 和 潜在 吸烟 者 收入 不 变 的 条 件 下 ,香烟 价格 提高 1% 对 香烟 消费 会 有 什么 影响 ? 
多 元 回归 模型 及 鞭 扩 展 模 型 提供 了 用 数据 回答 这 些 问 题 ,以 及 量化 与 这 些 问 题 答案 相关 的 
不 确定 性 的 框架 。 


.2_ 因果 效应 和 理想 化 实验 - 


和 经 济 计量 学 中 过 到 的 许多 其 他 问题 一 样 ,1. 1 节 中 的 前 三 个 问题 都 涉及 变量 间 的 因 
果 关 系 。 一 般 地 说 ,如 果 某 种 结果 是 某 种 行为 的 直接 后 果 或 结论 ,那么 ,就 称 该 行为 是 引致 
该 结果 的 原因 。 例 如 , 碰 到 热火 炉 会 导致 葛 伤 ; 喝 水 能 解渴 ;轮胎 充气 就 会 膨胀 ;给 西 红 硕 施 
肥 会 使 它们 结 出 更 多 的 果实 。 因 果 关 系 是 指 , 基 一 特定 行为 (如 施肥 ) 导致 了 某 一 特定 的 可 
测度 的 结果 ( 如 更 多 的 西红柿 ) 。 


1.2.1 因果 效应 的 估计 


我 们 怎样 才能 精确 地 测度 一 定 的 施肥 量 ,比方 说 每 平方 米 100 克服 料 ,对 西红柿 产量 的 
因果 效应 (用 千克 测度 的 )? 

测度 这 种 因果 效应 的 方法 之 一 就 是 进行 一 项 实验 。 在 这 个 实验 中 ,园艺 研究 人 员 在 多 
块 地 中 种 植 了 西红柿 ,给 每 块 地 以 同样 的 管理 ,只 有 一 点 除外 , 即 一 些 地 块 每 平方 米 施肥 
100 克 , 而 另 一 些 地 块 则 不 施肥 。 此 外 , 某 块 地 施 到 与 和 否 是 由 计算 机 随机 决定 的 ,这 样 确保 
了 地 块 之 加 的 任何 其 他 差异 都 和 施肥 与 无 关 。 在 收获 期 ,园艺 家 计算 出 每 块 地 的 产 出 , 施 
喝 的 地 块 和 没 施肥 的 地 块 平均 每 平方 米 产量 之 差 就 是 施肥 对 西红柿 产量 的 因果 效应 。 

这 是 随机 化 控制 实验 [randomized controlled experiment) 的 一 个 例子 。 说 它 是 控制 实 
验 ,是 因为 存在 一 个 控制 组 [control grdup) (地 块 ) ,这 个 组 中 没有 给 予 施肥 处 理 ;还 有 一 个 
处 理 组 {treatment group) ,这 个 组 中 给 予 了 施肥 处 理 (每 平方 米 100 克 的 肥料 ) 。 我 们 说 实 
验 是 随机 化 的 ,是 指 处 理 是 按 随机 原则 分 配 的 。 这 种 对 处 理 的 随机 分 配 排除 了 诸如 某 块 地 
的 日 照 情况 怎样 和 它 是 否 得 到 施肥 两 组 之 间 系 统 关系 的 可 能 性 ,因此 在 控制 组 和 处 理 组 之 
间 惟 一 的 系统 差异 就 是 施肥 处 理 。 如 果 该 实验 能 够 在 足够 大 的 规模 上 进行 ,那么 ,我 们 就 将 
会 得 到 一 个 因果 效应 的 侍 计 值 , 即 处 理 ( 每 平方 米 施 100 s£ EL) 邓 所 感 兴趣 的 结果 ( 西 红 
柿 产量 ) 的 因果 效应 合计 和 值 。 

本 书 中 ,因果 效应 (causal effect] 被 定义 为 一 个 给 定 的 行为 或 处 理 对 某 一 结果 的 影响 ， 




















就 像 在 一 个 理想 的 随机 化 控制 实验 中 所 测度 的 那样 。 在 这 样 的 实验 中 , 处 理 组 与 控制 组 之 
问 的 结果 产生 差异 的 惟一 的 系统 原因 就 是 处 埋 本 妨 、 

我 们 可 以 汕 想 用 一 个 理想 的 随机 化 控制 实验 来 回答 1. 1 节 中 提出 的 前 三 个 问题 。 例 
如 ,为 了 研究 班级 规模 问题 ,我们 可 以 假设 将 不 同班 级 规模 的 “处 理 ` 随机 地 分 配 到 不 同 的 
学 咎 群 组 。 如 有 果 设 计 并 执行 了 这 个 实验 ,使 学 生 群 组 之 间 惟 … 的 系统 差异 是 他 们 的 班级 规 
模 , 堵 么 理论 上 在 保持 其 他 条 件 不 变 的 情况 下 ,这 个 实验 将 会 估计 出 班级 规模 对 考试 成 绩 的 
BIB], 

理想 化 的 随机 化 控制 实验 是 一 个 非常 有 用 的 概念 ,因为 它 给 出 了 因果 效应 的 定义 。 然 
而 ,实际 上 进行 理想 化 的 实验 是 不 可 能 的 。 事 实 上 ,经 济 计量 学 中 实验 是 很 少见 的 ,因为 这 
些 实验 或 者 常常 不 符合 道德 标准 ,或 者 不 可 能 得 到 很 满意 的 执行 ,或 者 代价 非常 高 郧 。 尽 管 
如 此 ,理想 的 随机 化 控制 实验 的 慨 念 确实 为 使 用 实际 数据 进行 因果 效应 的 经 济 计量 分 析 提 
供 了 一 个 理论 基准 。 


1.2.2 预测 与 因果 关系 


尽管 1.1 节 中 的 前 三 个 问题 涉及 因果 关系 ,但 第 四 个 问题 , 即 预测 通货 膨胀 , 却 不 涉及 
因果 关系 。 为 了 做 出 一 个 好 的 预测 ,并 不 一 定 衔 要 知道 因果 关系 。 要 "预测 ”是否 正 在 下 
雨 , 一 个 好 的 办 法 是 观察 行人 有 没有 打 雨 伞 , 但 打 羡 全 的 行为 并 不 是 引起 下 十 的 原因 。 

尽管 预测 并 不 需要 涉及 因果 关系 ,但 宏观 经 济 理论 所 建立 起 来 的 模型 和 关系 ,对 预测 通 
货 脱 胀 却 是 很 有 用 的 。 我 们 在 第 12 章 将 会 看 到 ,多 元 回归 分 析 允 许 我 们 把 经 济 理论 所 揭示 
的 历史 关系 量化 出 来 ,允许 我 们 检验 这 些 关 系 是 否 随 着 时 间 的 推移 平稳 地 变化 ,允许 我 们 对 
未 来 进行 定量 的 预测 ,允许 我 们 对 这 些 预 测 结 果 的 精度 进行 评价 。 


1.3 数据 :来源 与 类 型 - 


经 济 计量 学 中 的 数据 主 归 有 两 个 来 源 ; 对 现实 世界 的 实验 或 非 实 验 观测 。 本 教材 既 分 
本 实验 数 据 集 ,也 分 析 非 实验 数据 集 。 


1.3.1 实验 数据 与 观测 数据 


实验 数据 {experimental datal] 来 源 于 实验 ,这 些 实验 或 者 是 设计 用 来 评价 一 项 处 理 或 
一 个 政策 ,或 者 是 用 来 检验 一 项 因果 兹 应 。 例 如 ,在 20 世纪 中 年代, 田纳西 州 资 助 了 一 项 
研究 班级 规模 对 学 习 效果 影响 的 大 型 随机 化 控制 实验 。 在 该 项 实验 中 { 第 11 章 我 们 将 分 
析 该 实验 的 数据 ) ,成 于 上 万 的 学 生 被 随机 地 分 配 到 不 同 规模 的 班级 中 ,研究 人 员 连 续 观 察 
几 年 ,每 年 都 进行 标准 化 考试 ,记录 考试 的 结果 。 

田纳西 州 的 班级 规模 实验 耗费 了 大 量 的 资金 ,并 日 要 求 众多 的 管理 者 ,家 长 和 教师 进行 
了 连续 好 几 年 的 合作 。 因 为 现实 生活 中 以 人 为 研究 对 象 的 实验 很 难 管理 和 控制 ,所 以 ,相对 
于 理想 随机 化 控制 实验 它们 还 存在 很 多 不 足 之 处 。 此 外 ,在 基 些 环境 下 ,实验 不 仅 昂贵 和 难 
于 管理 ,而 且 还 可 能 不 符 全 道德 标准 。! 比如 ,向 随机 选 定 的 十 几 岁 的 青少年 提供 廉价 的 香 
烟 以 了 解 他 们 会 买 多 少 ,这 项 实验 是 符合 道德 标准 的 吗 ?) 由 于 这 些 财 务 经 费 的 原因 .实际 
可 行 性 的 原因 以 及 道德 的 原因 等 ,经 济 学 中 很 少 进行 实验 。 相 反 ,大 多数 经 济 数据 是 通过 观 
测 现实 世界 的 行为 得 到 的 。 

通过 观测 实验 之 外 的 现实 世界 中 的 实际 行为 所 得 到 的 数据 , 称 为 观测 数据 











E 
问 


aiT 





#t 





(cbservatronal data) 。 观 测 数据 是 利用 抽样 调查 ( 如 对 消费 者 的 电话 调查 ) 和 行政 管理 记 
录 { 如 贷款 机 构 保 存 的 关于 抵押 贷款 申请 考 的 历史 记录 ) 搜 集 的 。 

观测 数据 对 试 醒 估 让 因果 效应 的 经 济 计量 学 提出 了 挑战 ,然而 ,经 济 计 是 学 的 工具 就 是 
处 理 这 些 挑战 的 。 在 现实 生活 中 “处理 "的 水 平 ( 如 西红柿 案例 中 的 施肥 量 ,班级 规模 案例 
中 的 掌 生 一 教师 比 ) 并 不 是 随机 分 配 的 ,因此 很 难 将 “处 理 ” 的 影响 从 其 他 的 相关 因素 中 分 
离 出 来 。 经 济 计量 学 的 大 部 分 内 容 , 也 即 本 书 的 大 部 分 内 容 , 都 是 致力 于 研究 在 用 现实 数据 
估计 因果 效应 时 所 过 到 的 挑战 及 其 解决 方法 的 。 

无 论 数据 是 实验 数据 集 还 是 观测 数据 集 , 一 般 者 有 三 种 主要 类 型 :截面 数据 ,时间 序列 
数据 .面板 数据 。 在 本 书 中 这 三 类 数据 都 会 遇 到 ， 


1.3.2 截面 数据 


不 同 实体 (如 工人 .消费 者 ,企业 ,政府 单位 等 ) 在 茶 一 单一 时 期 的 数据 称 为 截面 数据 
{cross-sectional data} 。 例 如 ,加利福尼亚 州 各 学 区 考试 成 绩 的 数据 就 是 截面 数据 。 因 为 
这 些 数据 是 420 个 实体 {学 区 ) 在 单 -- 时 期 (1998 年 ) 的 数据 。 一 般 地 说 ,用 n 来 表示 我 们 所 
观测 到 的 实体 个 数 ,因此 在 加 利 福 尼 亚 州 的 数据 集合 中 ,n =420。 

在 加 利 福 尼 亚 州 的 考试 成 绩 数 据 集中 ,每 一 个 学 区 都 包含 有 对 不 同 变量 的 测度 值 。 表 
1 一 1 别 出 了 其 中 的 部 分 数据 。 每 一 行列 出 了 不 同学 区 的 数据 。 例 如 ,第 一 个 学 区 (学 区 1) 
的 平均 考试 成 绩 是 690.8 ,这 是 该 区 1998 年 标准 化 考试 (斯坦福 达 标 考 试 ) 中 所 有 五 年 级 学 
生 的 数学 和 自然 科学 的 平均 成 绩 ;该 地 区 的 学 生 一 教师 比 是 17. 89, 即 学 区 1 的 学 生 人 数 被 
学区 1 的 任课 教师 人 数 除 得 到 17. 89。 第 一 个 学 区 每 个 学 生 的 平均 费用 是 6 385 美元 。 该 
学 区 中 仍 在 党 习 英 语 的 学 生 的 百分比 ( 即 把 英语 作为 第 二 语言 对 英语 还 不 精通 的 学 生 的 











百分比 ) 是 0%。 
表 1 一 1 1998 年 加 利禄 尼 亚 州 尝 区 的 考试 成 绩 和 其 他 变量 的 部 分 观测 值 
I bx PJ E I <a R re 
a Mw. 3 REN REAN FAHM a u A n a 
J 690, 8 17. 89 6 385 0.0 
2 661. 2 21. 52 5 099 4.6 
3 643.6 18. 70 5 502 30. 0 
4 647. 7 17. 36 7 102 0.0 
5 640.8 18.67 5 236 13.9 
418 645. Ü 21. 89 4 403 24.3 
419 672. 2 20. 20 4 776 3.0 
420 655. 8 19.04 5 993 5.0 





注 : 加 利 福 尼 亚 州 考试 成 线 数 据 集 在 附录 4 1 中 介绍 。 

祭 下 各 行 代表 其 他 学 区 的 数据 。 各 行 的 顺序 是 任意 排列 的 ,学 区 的 标号 ( 称 为 观测 序 
S {observation number)) 也 是 任意 分 配 的 数字 ,以 使 于 排序 。 从 表 1 一 1 中 可 以 看 出 , 列 出 
的 所 有 变量 值 变化 都 相当 大 。 

利用 截面 数据 ,通过 研究 在 单一 时 期 内 个 人 ,企业 或 其 他 经 济 实 体 之 间 的 差异 ,我 们 可 


RIS ”按照 州 和 年 份 表示 的 美国 各 州 香烟 销售 量 .价格 和 税率 的 部 分 观测 值 11985 一 1995 








BMW i ” Hf x A w LEO Y PJ fr 6 AMAR JJL) 
1 ri 
Hr (gq) (u K) LAREO MRH TR + int h: 
l EHEZ JII I985 LIG 5 1. 022 0. 333 
2 阿肯色 州 1985 128,5 1.015 0. 370 
3 亚 利 业 那州 1985 104.5 1. 086 0. 362 
47 PIB 2 J 1985 112.8 1. 089 0. 382 
48 怀俄明 州 1985 129.4 0. 935 0. 240. 
49 EHE ZH 1986 117.2 1. 080 0. 334 
96 怀俄明 州 1986 127.8 1. 007 0.240 
97 亚 拉 巴 马 州 1987 115,8 1. 135 D. 335 
528 怀俄明 者 1995 112,2 1. 585 Ü. 360 


注 : 香 烟 消 费 的 数据 集 在 附录 10. 1 中 介绍 。 

3 1 一 3 中 列 出 了 香烟 消费 数据 集中 的 部 分 数据 。 前 48 行 的 观测 值 从 亚 拉巴 马 州 到 怀 
俄 明 州 按 字 母 排 序列 出 了 1985 年 各 州 的 数据 。 楼 下 来 的 48 行 的 观测 值 列 出 了 1986 年 的 
数据 , 依 此 类 推 ,直到 1995 年 。 例 如 ,在 1985 年 ,阿肯色 州 的 香烟 销售 量 是 每 人 128.5 包 
(该 州 1985 年 销售 的 香烟 首 包 数 除 以 该 州 1985 年 的 总 人 口 数 得 到 128.5) 。 阿 肯 色 州 1985 
年 每 包 烟 含 税 的 平均 价格 是 1.015 美元 ,其 中 有 37 美 分 被 缴纳 了 联邦 税 . 州 税 和 地 方 税 。 

根据 面板 数据 ,可 以 了 解数 据 集 中 多 个 不 同 实体 的 经 济 关 系 ,以 及 每 个 实体 随时 间 变 化 


的 演变 关系 。 
截面 数据 .时 间 序列 数据 和 面板 数据 的 定义 在 重要 概念 1. 1 中 进行 总 结 。 
重要 概念 


截面 数据 .时 间 床 列 数据 和 面板 数据 
芽 和 截面 数 据 由 多 个 实体 在 单一 时 期 的 观测 值 组 成 。 
者 时 间 序 列 数据 由 单一 实体 在 多 个 时 期 的 观测 值 组 成 。 
者 面板 数据 (也 称 纵向 数据 ) 由 多 个 实体 在 两 个 或 两 个 以 上 时 期 的 观测 值 组 成 。 


总 =F 


1. 许多 高 业 和 经 济 中 的 决策 都 需要 知道 一 个 变量 的 变化 如 何 影响 男 一 个 变量 变化 的 
定量 估计 值 。 

2， 从 理论 上 说 ,估计 一 个 因果 效应 的 方法 是 在 一 个 理想 的 随机 化 控制 实验 下 进行 的 ， 
但 在 经 济 应 用 中 进行 这 样 的 实验 通常 是 不 符合 道德 标准 的 .不 实际 的 ,或 是 过 于 昂贵 的 。 

3. 经 济 计时 学 提供 了 利用 观测 ( 非 实验 的 ) 数 据 或 来 自 于 现实 世界 的 不 完备 的 实验 数 





据 估计 因果 效应 的 工具 。 

4. 礁 面 数据 是 通过 在 单一 时 点 上 观测 多 个 实体 得 到 的 ;时 间 序 列 数 据 是 通过 在 多 个 时 
点 上 观测 单一 实体 得 到 的 ;而 面板 数据 是 通过 观测 多 个 实体 得 到 的 ,其 中 每 个 实体 都 在 多 个 
时 点 上 被 观测 。 





-重要 术语 . 


随机 化 控制 实验 ”控制 组 处 理 组 因果 效应 实验 数据 观测 数据 截面 数据 M 

测序 号 时间 序列 数据 ”面板 数据 ”纵向 数据 
复习 概念 

1.1 设计 一 个 假设 的 .理想 的 随机 化 控制 实验 来 研究 学 习 时 间 对 微观 经 济 学 课程 考试 
成 线 的 影响 ,并 列 出 实际 上 执行 这 个 实验 的 障碍 。 

1.2 设计 一 个 假设 的 ,理想 的 随机 化 控制 实验 来 研究 系 安全 带 对 高 速 公路 交通 事故 死 
亡 率 的 影响 ,并 列 出 实际 上 执行 这 个 实验 的 障碍 。 

1.3 ”如 果 要 你 研究 一 个 制造 厂 职工 的 培训 时 间 ( 用 每 个 职工 每 周 的 小 时 数 测量 ) 与 职 
工 的 生产 率 ( 每 个 员工 每 小 时 的 产 出 量 ) 之 间 的 关系 ,请 叙述 ， 

a 测度 这 个 因果 效应 的 一 个 理想 的 随机 化 控制 实验 ; 

b. 你 用 来 研究 这 个 因果 效应 的 截面 观测 数据 集 ; 

e. 你 用 来 研究 这 个 因果 效应 的 时 间 序 列 观测 数据 集 ; 

d, 你 用 来 研究 这 个 因果 效应 的 面板 观测 数据 集 。 








2.1 随机 变量 和 概率 分 布 - 


2.1.1 概率 ,样本 空间 和 随机 变量 


MPRA ”你 中 到 的 下 一 个 陌生 人 的 性 别 ,你 的 考试 成 绩 ,你 在 写 学 期 论文 时 电脑 死 
机 的 次 数 ,这些 都 含有 偶然 因素 或 随机 性 。 在 每 -个 例子 中 ,都 存在 一 定 的 未 知性 ,但 这 种 
未 知性 最 终 会 被 揭晓 。 

一 个 随机 过 程 所 产生 的 相互 罪 斥 的 可 能 后果 被 称 为 结果 {outcomes) 。 例 如 ,你 的 电脑 
可 能 从 不 死机 ,可 能 死机 1 次 ,也 可 能 死机 两 次 ,如 此 等 等 。 这 些 结果 中 只 有 一 个 会 真正 发 
生 { 结果 是 相互 排斥 的 ) ,而 旦 这 些 结果 的 发 生 的 可 能 性 并 不 需要 是 等 同 的 。 

结果 的 概率 [ probability) 是 指 这 个 结果 长 期 发 生 次 数 的 比率 。 如 果 在 你 写 一 篇 学 期 论 
六 的 时 候 , 电 脑 不 死机 的 概率 是 80% ,那么 在 写 许多 篇 学 期 论文 的 过 程 中 ,你 会 完成 80% 89 
写作 任务 ,同时 电脑 不 死机 。 

样 椒 室 间 与 得 人 ”所 有 可 能 结果 的 集合 被 称 为 样本 空间 {sample space), 事件 
(event) 是 样本 空间 的 一 个 子 集 , 即 事件 是 一 个 或 多 个 结果 的 集合 。“ 我 的 电脑 死机 不 超过 
1 次 "这 个 事件 是 由 两 个 结果 组 成 的 集合 : “不 死机 ”和 "死机 1 次 ”。 

部 机 交 仙 ”随机 变量 是 一 个 随机 结果 的 一 系列 数值 表示 。 当 你 写 一 篇 学 期 论文 时 ,你 
的 电脑 死机 的 次 数 是 随机 的 ,并 取 一 个 特定 的 数值 ,因此 它 就 是 一 个 随机 变量 。 

一 些 随机 变量 是 离散 的 ,一 些 随机 变量 是 连续 的 。 顾 名 思 义 ,离散 型 随机 变量 (discrete 
random variable) 只 能 取 离 散 的 数值 ,如 0,1,2,…, 而 连续 型 随机 变量 {continuous random 
variable ) 则 取 可 能 值 的 连续 区 疗 。 


2.1.2 离散 型 随机 变量 的 概率 分 布 


概 钉 分布” 离散 型 随机 变量 的 概率 分 布 ( probability distribution) 就 是 变量 的 所 有 可 能 
值 和 每 个 值 发 生 的 概率 的 列表 。 这 些 概率 之 和 等 于 1。 

例如 ,用 # 表示 在 你 写 学 期 论文 时 电脑 死机 的 次 数 。 随 机 变量 并 的 概率 分 布 就 是 每 个 
可 能 结果 的 概率 的 列表 :对 =0 的 概率 是 电脑 不 死机 的 概率 ,表示 为 Pr( M =0);Pr( M = 1) ÉE 
电脑 死机 1 次 的 概率 ; 依 此 类 推 。 表 2 一 1 的 第 2 行 给 出 M 概率 分 布 的 一 个 例子 。 在 这 个 
分 布 中 ,如果 你 的 电脑 死机 4 次 ,你 将 放弃 使 用 电脑 而 改 用 手写 论文 。 根 据 这 个 分 布 ,不 死 
机 的 概率 为 80% ; 363) 1 次 的 概率 为 10% ;死机 2 次 ,3 次 或 4 次 的 概率 分 别 为 6% ,3 和 和 
1 各。 这 些 概率 之 和 等 于 100 和 。 这 个 概率 分 布 绘制 在 图 2 一 ! 中 。 











表 2 一 ! 你 的 电脑 死机 M 次 的 概率 
| 结果 ( 死机 次 数 ) 
| Ü 1 2 3 4 
概率 分 布 0.80 0. 10 0.06 0.03 D. 01 
黑 积 概率 分 布 0. 80 0.90 0. 96 0). 99 1.00 





宇 件 的 概率 。 事 件 的 概率 可 以 从 概率 分 布 中 计算 。 例 如 ,死机 1 次 或 2 次 事件 的 概率 
是 表 中 对 应 结果 的 概率 和 , 即 Pr M = 1 sË M =2) =Pr(M = 1) +Pr( M =2) =0. 10 +0. 06 = 
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死机 次 数 
注 :每 个 柱 形 的 高 度 是 所 标明 的 电脑 死机 次 烙 的 概率 。 第 一 个 柱 形 的 高 度 是 0. 如 ,因此 ,电脑 死机 
0 次 的 概率 是 80% ;第 二 个 福 形 的 高 度 是 0. 1, 因 此 ,电脑 死机 1 次 的 概率 是 10 铝 ;其 他 柱 形 的 含义 依 此 


类 推 。 
2 一 1 ”电脑 死机 次 数 的 概率 分 布 


0. 16 ,或 表示 为 16 名 。 

BEURA REMES t cumulatve probability distribution) 是 随机 变量 小 于 或 
等 于 某 个 特定 值 的 概率 。 表 2 一 ! 的 最 后 一 行 给 出 了 随机 变量 时 的 累积 概率 分 布 。 例 如 ， 
至 多 死机 ] 次 的 概率 pr( M < 1) Æ 90%, 它 是 不 死机 的 概 举 (80%) 和 死机 1 次 的 福 率 
(10% ) 之 和 。 

累积 概率 分 布 也 常 被 称 为 早 积 分 布 范 数 {{ cumulative distribution function) c. d. t. }, 
ARH É (cumulative distribution) 。 

贝 努 型 分 布 “ 离 散 型 随机 变量 的 一 个 重要 的 特殊 情形 就 是 随机 变量 是 二 元 的 , 即 结果 
是 0 或 1。 二 元 随机 变量 被 称 为 由 努 里 随机 变量 ( Bernouli variable) (为 纪念 17 世纪 瑞士 
数学 家 和 科学 家 Jacob Bernoulli) , 它 的 概率 分 布 被 称 为 贝 努 里 分 布 {Bernoulii distribution ) 。 

例如 ,假设 6 是 你 直到 的 下 一 个 卫生 人 的 性 别 ,其 中 6=0 表示 这 个 人 是 男性 ,C =1 表 
示 这 个 人 人 是 女性 。 因 而 ,6 的 结果 和 对 应 的 概率 为 ; 

1 概 沦 为 
c= 和 EENI- 2D 
其 中 ,p 是 你 遇 到 的 下 一 个 陌生 人 为 女性 的 概率 。 公 式 (2.1) 中 的 概率 分 布 就 是 贝 努 里 
分 布 。 


2.1.3 连续 型 随机 变量 的 概率 分 布 


累积 构 定 分 外 ”连续 型 随机 变量 的 累积 概率 分 布 的 定义 与 离散 型 随机 变量 的 累积 概率 
分 布 类 似 。 也 就 是 说 ,连续 型 随机 变量 的 累积 概率 分 布 是 随机 变量 小 于 或 等 于 某 个 特定 什 
的 概率 。 


例如 , 考 雹 一 个 从 家 开车 到 学 以 的 学 生 这 个 学 生 的 通勤 时 间 可 以 取 某 值 的 一 个 连 纺 
的 区 间 , 因 为 它 依 精 于 诸如 天 气 和 交通 状况 的 随机 因素 ,自然 地 将 其 看 做 是 连续 弄 随 机 变 
红 。 图 2 一 20a) 描 玻 了 一 个 通 骑 时 间 假 定 的 累积 权 率 个 布 ， 例如 , 通 支 伦 费 的 时 间 少 手 15 
分 钟 的 概率 是 30 名 ,不 超过 20 分 圳 的 概 雍 是 78 
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到 出 离散 者 随机 亚 量 每 个 可 能 值 的 概率 折 使 用 的 概率 分 布 的 方法 就 不 透 台 连战 地 随机 变量 
Ta 相反 ,连续 型 随机 变量 是 用 慨 率 富 度 画 歼 | Probability dansily tuncltion] 来 刻 表 的 。 在 
区 率 害 度 函 姓 下 ,任意 西点 间 的 面积 就 是 该 随机 计量 落 在 那 两 个 点 志向 的 慨 党 。 EEEE 








函数 还 被 称 为 p. d. f. ,密度 函数 (density function) ,或 简称 为 密度 (density}。 

图 2 一 2(b) 描绘 了 与 图 2 一 2(a) 累积 概率 分 布 相对 应 的 通勤 时 间 的 概率 密度 匡 数 。 在 
15 ~ 20 分钟 之 间 的 p. d. f. 下 的 面积 给 出 了 通勤 时 间 在 15 至 20 分 钟 之 间 的 概率 , 它 是 0. 58 
或 58% 。 同 样 , 这 个 概率 值 也 可 以 通过 图 2- 一 2(a) 中 的 累积 分 布 图 反映 出 来 , 即 用 通勤 时 间 
JT 20 分 钟 的 概率 (78% ) 减 去 通勤 时 间 少 于 15 分 钟 的 概率 (20% ) 所 得 之 差 。 因 此 ,概率 
密度 函数 和 黑 积 疾 率 分 布 是 以 不 同 的 形式 表达 相同 的 信息 。 


已 2 期望值 .均值 和 方差 ] 


2.2.1 随机 变量 的 期 望 值 


期 望 值 。 随 机 变量 了 的 期 望 值 expected value| 是 多 次 重复 试验 或 发 生 的 过 程 中 随机 
变量 的 长 期 平均 值 ,表示 为 R(Y) 。 计 算 离散 型 随机 变量 的 期 望 值 ,是 将 该 随机 变量 的 可 能 
结 困 加 权 平 均 , 这 里 权 数 就 是 对 应 的 结 黑 的 概率 。 变 量 了 的 期 望 值 也 被 称 为 了 的 期 户 
{expection) ,或 了 的 均值 {mean) ÆRA tyo 

例如 ,假设 你 以 10 免 的 利率 贷款 100 美元 给 你 的 一 位 朋友 。 如 果 贷 款 得 到 偿还 ,你 就 
可 以 得 到 110 美元 (100 美元 本 金 加 上 10 美元 利息 ) ,但 如 果 你 的 朋友 有 1 名 的 违约 风险 ,你 
就 会 什么 也 得 不 到 。 因 此 ,你 得 到 的 偿还 数量 是 个 随机 变量 ,你 有 0. 99 的 概率 得 到 110 美 
元 ,有 0.01 的 概率 得 到 10 美元。 在 许多 这 样 的 借贷 中 ,你 得 到 偿付 110 3826851228 99% , 
但 什么 都 得 不 到 的 机 会 有 1 免 ,因此 平均 来 看 ,你 将 被 偿付 110 x0.99 +0 x0.01 =108.90 
(美元 )。 这 样 ,你 的 偿付 期 望 值 (或 “平均 偿付 " ;是 108. 90 美元 。 

另 一 个 例子 ,考虑 表 2 一 1 中 给 定 的 概率 分 布 的 电脑 死机 次 数 M. M 的 期 望 值 是 在 许多 
学 期 论文 写作 期 间 的 平均 死机 次 数 , 以 给 定 大 小 死机 次 数 的 发 生 频 率 为 权 数 ,可 以 得 出 : 

E(M) =0 x0,8 +I x0.10+2 x0. 06 +3 x0. 03+4x0 01 =Ü. 35 (2.2) 
也 就 是 说 ,在 写 一 篇 学 期 论文 时 ,电脑 死机 次 数 的 期 望 值 是 0. 35。 当 然 ,实际 死机 次 数 必定 
都 是 整数 。 在 写 一 篇 特殊 学 期 论文 时 电脑 死机 0. 35 次 是 没有 意义 的 ! 更 确切 地 说 ,公式 
{2.2) 中 的 计算 意味 着 在 许多 这 样 的 学 期 论文 写作 期 间 死 机 的 平均 次 数 是 0. 35。 

取 大 个 不 同 值 的 离散 型 随机 变量 了 的 期 望 值 表 达 式 在 重要 概念 2 1 中 给 出 。 

贝 努 里 随机 变量 的 期 望 值 。 重 要 酸 念 2. 1 中 一 般 贿 达 式 的 一 个 重要 的 特殊 情形 是 贝 努 
里 随机 变量 的 均 信 。 设 6 是 公式 (2.1) 中 概率 分 布 的 贝 努 里 随机 变量 。6 的 期 望 信 是 : 

F(G)=lxp+0x(1-p) =p (2.3) 
因此 ,由 努 里 随机 变量 的 期 望 值 等 于 p, 即 它 取 值 为 "1" 时 的 概率 。 

连续 型 随机 变量 的 期 望 值 。 连 续 型 随机 变量 的 期 望 值 也 是 该 随机 变量 的 可 能 结果 的 概 
率 加 权 平 均 。 由 于 连续 型 随机 变量 可 以 取 连 续 的 值 ,因此 ,连续 型 随机 变量 的 期 望 的 正式 数 
学 定义 涉及 微 积分 , 它 的 定义 在 附录 15.1 中 给 出 。 


重要 概念 2. 1 























期 奸 值 和 均值 
恨 设 随机 变量 Ye k 个 可 能 的 值 ,入 Paia ,其 中 ry 表示 第 一 个 值 ,x 表示 第 二 个 值 ， 
RERE, YEr 的 概率 为 pi ,了 取 的 概率 为 p., 依 此 类 推 。 用 上 (了 表示 了 的 期 望 值 ， 
它 是 : 





k 
ELY) = 入 Pi tp te + HD = Š yp, (2.4) 
1=1 


其 中 ， > yp. ARE i WEMA I 变化 到 时 jp, 的 和 ”。Y 的 期 望 值 也 被 称 为 了 的 均 
值 或 了 的 期 望 .通常 用 mr 表示 。 


2.2.2 方差 ,标准 差 和 算 


方差 和 标准 茎 测度 概率 分 布 的 离散 程度 或 “分 散 程 度 ”。 随 机 变量 了 的 方差 
(variance) ,是 了 对 其 均值 的 离 差 平方 的 期 望 值 , 表 示 为 varė Y), B var(Y) = E[( Y - 
pr) le 

由 于 方差 包含 了 的 平方 ,因此 ,方差 的 单位 也 就 是 了 的 单位 的 平方 ,这 使 得 方差 很 难 解 
释 , 所 以 ,通常 用 标准 差 { standard deviation) 米 测度 离散 程度 , 它 是 方差 的 平方 根 ,表示 为 
Tyo 标准 差 和 了 有 相同 的 单位 。 这 些 定义 在 重要 概念 2.2 中 进行 总 结 。 

例如 ,电脑 死机 次 数 M 的 方差 是 M 与 其 均值 0. 33 之 善 的 平方 的 概率 加 权 平 均 数 。 

var( M) = (0 -0.35)° x0. 80 + (1 -0.35)° x0. 10 + (2 - 0. 3532 x0, 06 

+(3-0.35) 0.03 +(4 -0 35) x0 H =0 6475 (2.5) 


M 的 标准 差 是 方差 的 平方 根 ,因此 ,ow =vG 5475~0.80。 
重要 概念 2.2 





方差 和 标准 盖 
用 cy 表示 的 离散 型 随机 变量 了 的 方差 是 ; 
oy=va(Y)=E[(Y-n) ] = y (y, - pr) p, "(2.6) 


Y 的 标准 差 是 oy, 即 方差 的 平方 根 。 标 准 差 的 单位 与 的 单位 相同 。 

贝 努 里 随机 变量 的 方差 。 公 式 (2. 1) 中 概率 分 布 的 贝 努 里 随机 变量 G 的 均值 是 He = p 
{公式 (2.3)) ,所 以 , 它 的 方差 是 : 

var(G) =o; = (0-p)'x (1-p} +(1-p): xp=p(1 -p) (2.7) 

E, nl OLEE RREZEN o; =vP(T-p)。 

R. 了 的 均值 下 瑟 还 被 称 为 了 的 一 阶 矩 ,了 的 平方 的 期 望 值 民 7” ) 还 被 称 为 了 的 二 阶 
矩 。 一 般 地 说 ,Z :的 期 望 值 被 称 为 随机 变量 了 的 了 阶 纸 {7” moment) ,也 就 是 说 ,了 的 r 阶 
HE EY’), 

就 像 均 值 是 分 布 集中 的 程度 测 诬 一 样 ,标准 差 是 分 布 的 离散 程度 的 测度 。r >2 时 的 矩 
测度 ,揭示 了 随机 变量 分 布 形 状 的 其 他 方面 的 信息 。 在 本 书 中 ,分 布 的 高 阶 矩 (r >2 时 的 
算 ) 主 要 在 重要 的 统计 方法 和 经 济 计量 方法 的 数学 假设 和 推导 中 使 用 。 


2.2.3 ”随机 变量 线性 函数 的 均值 和 方差 


这 部 分 讨论 由 一 个 线性 函数 联系 起 来 的 随机 变量 (如 XX 和 了 )。 例如 ,考虑 一 个 所 得 税 
方案 。 在 这 个 方案 下 ,个 人 的 收 人 以 20% 的 税率 被 征 税 ,然后 给 2 000 美元 的 补助 金 (免税 
的 ) 。 在 这 个 税收 方案 下 ,将 税 后 收入 了 与 税 前 收入 天 联系 起 来 的 方程 为 : 


Y =2 000 +0. 8X (2.8) 
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表 2 一 2 天 气 状况 和 通勤 时 间 的 联合 分 布 
两 天 {(T =0) 晴 大 (X=1) 合计 
通勤 时 间 长 (Y=0) 0.15 0.07 0.22 
通勤 时 间 短 (了 = 1) 0.15 0.63 0.78 
合 计 0 30 0 70 1.00 


边缘 概率 分 布 。 头 机 变量 了 的 边缘 概率 分 布 { marginal probability distribution) 只 是 其 
概率 分 布 的 另 一 个 和 名称。 这 个 术语 用 来 区 分 单个 变量 了 的 分 布 (边缘 分 布 ) 和 了 与 另 一 个 
随机 变量 的 联合 分 布 。 

9 呆 由 革 和 了 的 联合 分 布 通过 将 了 取 特定 值 的 所 有 可 能 结果 的 概率 加 起 来 计算 了 的 边 
绿 分 布 。 和 如 果 针 可 取 i 个 不 同 的 值 *,… ,xi, 那 么 了 取 特 定 值 y 的 边缘 概率 是 : 


Pr(FY=7y7) = >` Pr X=z,,Y=y) (2. 14) 
r=! 


例如 ,在 表 2--2 h, F B E 8 šbisr lal £ B 483 e 15% ,不 下 雨 且 通 勤 时 间 长 的 概率 是 
7% ,因此 通勤 时 间 长 的 概率 (下 雨 或 不 下 雨 ) 是 22 免 。 通 勤 时 间 的 边缘 分 布 在 表 22 的 最 
后 一 列 给 出 。 同 理 , 下 十 的 边缘 概率 是 30% ,如 表 2—2 的 最 后 一 行 所 示 。 


2.3.2 条 件 分 布 


Rita. MENEE AX 到 特定 值 为 条 件 的 随机 变量 了 的 概率 分 布 被 称 汶 给 定 X E 
T YRS B (conditional distribution of Y given X), ` X RA x B, Y RHA y 的 
条 件 概率 被 记 为 Pr(Y = ylX =x). 

例如 ,如 果 你 知道 天 气 下 十 ( 工 =0) ,那么 通勤 时 间 长 (7 =0) 的 概率 是 多 少 ? RER 
2 一 2 可 知 ,下 两 且 通勤 时 间 短 的 联合 概率 是 15 和 名 ,下 雨 且 通勤 时 间 长 的 联合 概率 也 是 
15% ,所 以 ,如 果 下 两 ,通勤 时 间 长 和 通勤 时 间 短 的 可 能 性 是 等 喇 的 。 因 此 ,以 下 十 (X=0) 
为 条 件 的 通勤 时 间 长 (Y=0) 的 概率 是 和 名 ,或 Pr( 了 =01X=0) =0.50。 同 理 , 下 雨 的 边缘 
概率 是 30% ,也 就 是 说 在 多 次 通勤 中 有 30% 的 机 会 遇 到 雨 下 。 在 这 30% 的 通 勒 时 间 里 ,有 
50% 的 机 会 通勤 时 间 长 (0. 1570. 30)。 

一 般 地 说 ,给 定 世 =x 条 件 下 了 的 条 件 分 布 为 ， 


Pr(Y=ylX =x) rreran (215) 


创 如 ,假如 下 十 ,通勤 时 间 长 的 条 件 概率 为 PF(Y=0IX=0) =Pr(X=0,Y=0)/Pr(X=0) = 
0.15/0.3 =0. 50, 

我 们 再 看 电脑 死机 的 这 个 例子 。 假 设 你 用 图 书馆 的 电脑 打印 学 期 论文 ,并 且 管 理 员 在 
那些 可 以 选择 的 电脑 中 为 你 随机 地 指定 一 台 。 这 些 电 脑 一 半 是 新 的 ,一 半 是 旧 的 。 自 于 你 
使 用 的 电脑 是 随机 指定 的 ,因此 ,你 所 使 用 的 电脑 的 新 旧 程 度 4( 如 果 电 脑 是 新 的 ,那么 4= 
1; 如 果 电 脑 是 旧 的 ,那么 4=0) 是 个 随机 变量 。 假 定 随 机 变量 M 和 4 的 联合 分 布 由 表 2 一 3 
的 4 部 分 给 出 ,那么 ,在 给 出 了 电脑 的 新 旧 程 度 的 条 件 下 ,电脑 死机 次 数 的 条 件 概率 分 布 在 
表 的 B 部 分 中 给 出 。 例 姐 , =0 且 4 =0 的 联合 概率 是 0.35。 由 于 一 半 电 脑 是 旧 的 ,假如 
你 使 用 旧 电 脑 ,不 死机 的 条件 慨 率 是 Pr(M=014=0) =Pr(M=0,4=0)/Pr(4=0) =0.35/ 
0.5 =0.70 ,或 表示 为 70% 。 相 反 , 假 设 给 你 指定 一 台新 电脑 ,不 死机 的 条 件 概率 是 90% 。 
根据 表 2 一 2 的 B 部 分 中 的 条 件 分 布 ,新 电脑 比 旧 电脑 更 不 可 能 死机 ,例如 , 旧 电 蒿 死机 3 次 














的 概率 是 5%% ,而 新 电脑 仅 为 1 狗 。 

284 HJ WT XRT Y 的 条 件 期 望 {conditional expectlon of Y given X) EAE X 
条 件 下 了 的 条 件 分 布 的 均值 ,也 被 称 为 给 定 X 条 件 下 Y 的 条 件 均值 [conditional mean of Y 
given X) 。 也 就 是 说 ,条 件 期 望 是 利用 给 定 了 条 件 下 了 的 条 件 分 布 所 计算 的 了 的 期 望 值 。 
R YR k TÍ y y ,那么 给 定 阅 = 条件 下 了 的 条 件 均值 是 : 


k 
E(Y!¥ =z) = > y,P.( Y= y,|X =x) (2.16) 
i=] 


例如 REE 2 一 3 中 的 条 件 分 布 , RE REHAS, a RENAR EAE EC MIA = 
0) =0x0.70+1x0.13+2 x0.10+3x0.05+4x0.02=0.56。 如 果 电 脑 是 新 的 ,电脑 死机 
HEERE EMIA =1) =0. 14, 比 上 日 电脑 的 死机 次 数 少 。 














表 2 一 3 电脑 死机 次 数 [ M) 和 电脑 新 旧 程 度 [4) 的 联合 分 布 和 条 件 分 布 
A. 联合 分 布 
M=0 M=1 对 =2 M=3 M=4 合计 
旧 电 脑 t4 =0) 0.35 0. 065 0.05 0.025 0.01 0.50 
新 电脑 (4 =1) 0.45 0. 035 0.01 0.005 0.00 0.50 
# iF 0.8 0.1 0.06 0.03 0.01 t.00 
B. EANA EIET M MISESA l 
对 =0 4 =1 M =2 M=3 M=4 合计 
Pri MIA =0) 0.70 013 — 010 0.05 0.02 1.00 
` Pr(MIA=1) 0.90 0.07 0.02 0.01 0. 00 1.00 


E X Ea 时 了 的 条 件 期 望 正好 是 当 X=x 时 了 的 平均 值 。 在 表 2-3 的 例子 中 , 旧 电 
脑 死 机 的 平均 次 数 为 0.56 次 ,因此 ,假如 电脑 是 旧 的 ,了 的 条 件 期 望 是 0.56 次 。 同 理 , 在 新 
电脑 中 ,平均 死机 的 次 数 是 0. 14 次 ,也 就 是 说 ,假如 电脑 是 新 的 ,7 的 条 件 期 望 是 0. 14 次 。 

累 期 望 法 则 。 了 的 均值 就 是 给 定 二 条 件 下 用 革 的 概率 分 布 作 为 权重 的 了 的 条 件 期 望 的 
加 权 平 均 。 例 如 ,成 年 人 的 平均 身高 是 用 男女 比例 作为 权重 的 男人 平均 身高 和 女人 平均 身 
高 的 加 权 平均 。 用 数学 式 表 这, 如 果 计 取 1 个 不 同 的 值 x，…,% ,那么 ; 


了 
E( Y) = > E(YIX=x,)Pe(X = x 5 (2.17) 


等 式 (2.17) 可 由 公式 (2. 16) 和 公式 (2 15) 推 导 得 出 { 见 练习 2.9)。 

换 名 话说 ,了 的 期 望 就 是 给 定 二 时 工 的 条 件 期 望 的 期 望 , 即 : 

ECF) =E[EO¿Y1X)] (2.18) 

其 中 ,公式 (2. 18) 右 边 的 括号 内 的 期 望 ,是 利用 给 定 志 时 了 的 条 件 分 布 计算 出 来 的 ,而 括号 
外 面 的 期 望 是 使 用 的 边缘 分 布 计算 出 来 的 。 公 式 (2. 18) 就 是 著名 的 黑 期 望 法 则 (law of 
iterated expectation) 。 

例如 ,死机 次 数 M 的 均值 ,是 在 假定 电脑 是 新 的 时 M 的 条 件 期 望 与 假定 电脑 是 旧 的 时 
M 的 条 件 期 望 的 加 权 平 均 数 ,因此 ,ECM) =E(MIA=0) xPr(4=0) +E(MIA=1) xPr(4 
=1) =0. 56 x0. 50 +0. 14 x0.50=0.35, 这 就 是 凡 边 绿 分 布 的 均值 ,与 等 式 (2.2) 所 计算 的 
结果 一 样 。 

累 期 望 法 则 的 全 六 是 ,如 果 纵 定时 了 的 条 件 均 值 为 0, 那 么 了 的 均值 就 是 0。 这 是 公 
式 (2. 18) 的 直接 结论 :如 果 ECTIX) =0, 那 么 =ELE(CYIXY)] = 五 (0) =0。 换 句 话说 , 如果 给 


定 衬 的 条 件 下 了 的 汐 值 为 0, 那 么 这 些 条件 均 值 的 概率 加 权 平 均 也 一 定 等 于 0, 也 就 是 说 ,了 
的 均值 -- 定 为 0。 

Zir, MUXAR Y kA Æ (variance of Y conditional on X AERA E X IE 
下 了 的 条 件 分 布 的 方差 。 用 数学 式 表 ,给 定 条 件 下 的 了 的 条 件 分 布 的 方差 为 ， 


varl YIX = x) = y [y -E(YIX =x) PPY ay, IX =x) (2.19) 


例如 ,假如 电脑 是 旧 的 ,死机 次 数 的 策 件 方差 var (M14) = (0 一 0.56)? x0.70 + (1! — 
0.56)2 x0. 13 + (2 -0.56)2 x0. 10 + (3 -0.56)2 x0.05 + (4 -0. 56)? xD. 02 =0. 99 , FE, 
假如 A =0,M 条 件 分 布 的 标准 差 为 v0.99 =0.99。 假 如 4 =1,M 的 条 件 方差 是 表 2 一 3 的 第 
二 行 中 分 布 的 方差 ,结果 为 0.22 ,因此 ,新 电脑 开 的 条 件 标准 差 是 /0. 22 =0.47。 对 表 2 一 3 
中 的 条 件 分 布 而 言 ,新 电脑 死机 的 期 望 次 数 (0. 14) 要 比 旧 电脑 的 {0.56) 少 ,而 且 如 条 件 标 
准 差 所 测度 的 一 样 ,新 电脑 死机 次 数 的 分 布 离散 程度 (0. 47) 比 朋 电脑 的 {0. 99) 小。 


2.3.3 独立 性 


如 果 知 道 一 个 变量 的 值 不 会 提供 有 关 另 一 个 变量 的 任何 信息 ,那么 两 个 随机 变量 XX 和 
了 就 是 独立 分 布 的 (Independenthy distribution} 或 者 说 是 独立 的 {independent) 。 严 格 而 
言 ,如 果 给 定 工 条 件 下 了 了 的 条 件 分 布 等 于 了 的 边缘 分 布 ,那么 工 和 了 就 是 独立 的 。 也 就 是 
说 ,如 果 对 所 有 *% Myt, 
Pr(F=y|X=s)=P6€0 Y=y) (XX 与 了 独立 ) (2.20) 
那么 不 和 了 是 独立 分 布 的 。 
将 公式 (2. 20) 代 入 公式 (2. 15) 中 ,我们 使 会 得 出 独立 随机 变量 以 联合 分 布 形式 表示 的 
另 一 种 表达 式 。 如 果 下 和 了 是 独立 的 ,那么 
Pr(Y=y,X =x) =Pr( X =x)Pr( Y= y) (2.21) 
tup W 3 r Ra at k rapip E A 85128 E 


2.3.4 协 方差 与 相关 系数 


协 方 差 。 测 度 两 个 随机 变量 共同 变化 程度 的 一 个 指标 就 是 它们 的 协 方差 。X 和 了 之 间 
的 协 方差 {covariance) 就 是 期 望 值 E[(X -ur) (Y -pv) ] ,这 里 jx 是 了 均值 ,py 是 了 均值 。 
用 co( X, YR ri 表示 协 方差 ,如 果 王 取 个 值 了 到 天 个 值 ,那么 它们 的 协 方差 公式 为 


cov(X,Y) =ar =EL (X-p;)(Y-uy)] 
+ E 
= 2 E (x -a)-e P(X sx, Y =y.) (2.22) 
1=Í jel 


为 了 解释 这 个 公式 ,假设 当 庆 大 于 它 的 均值 时 ( 即 半 -jx >0), 了 也 倾向 于 大 于 它 的 均 
ECE Y -u >0) ;而 当天 小 于 它 的 均值 时 ( 即 王 -Ar <0) ,了 也 倾向 于 小 十 它 的 均值 ( 即 了 
-Ar <0) 。 在 这 黄种 情况 中 ,乘积 项 (了 -Ar ) (XX -px) 都 倾向 于 为 正 的 ,所 以 它们 的 协 方差 
就 是 正 的 。 相 反 ,如果 天 和 了 了 倾向 于 向 相反 方向 变化 ( 即 当 了 很 小 时 二 却 很 大 ,反之 亦 然 ) ， 
那么 它们 的 协 方差 就 是 负 的 。 最 后 ,如 果 半 和 了 是 独立 的 ,那么 它们 的 协 方差 为 0( 见 练习 
2.9). 

相关 系数 。 由 于 协 方差 是 XY 和 了 与 其 均值 的 离 差 之 积 ,因此 , 它 的 单位 就 是 了 的 单位 
乘 以 了 的 单位 ,用 起 来 很 别扭 。 这 个 “单位 "问题 使 得 协 方差 的 数值 很 难 解释 。 

相关 系数 是 下 和 了 之 间 相 关 程度 的 另 一 个 测度 , 它 解 决 了 协 方差 的 “ 单位" 问题。 具体 
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地 说 ,站 和 了 之 问 的 相关 系数 ( correlation) B: X 和 了 的 协 方差 除 以 它们 各 自 的 标准 差 ， 
cov( X,Y) -on 
«varl 下)J)varf F) dxror 
由 于 会 式 (2. 23) 中 分 子 的 单位 与 分 母 的 单位 相同 ,因此 这 些 单位 被 抵消 了 , 祖 关 系数 
是 无 单位 的 。 如 果 corr(T,P) =0 ,那么 称 随 机 变量 三 和 了 是 不 相关 的 (uncorrelated ] , 
正如 在 附录 2 工 中 所 证 明 的 ,相关 系数 的 值 总 是 在 -1 和 1 之 间 , 即 ; 


corr( X,Y) = (2.23) 


-lger A, Y) 所} {相关 系数 不 等 式 } (2.24) 
HARA ATHS WE Y REPRIT X IA Y sU X ETAR, BI: 
如 果 ECYIX) = 那么 cov( Y, X) =0 H con( Y, XK) =0 (2.25) 


现在 我 们 证 明 这 个 结论 。 首 先 假设 XY 和 Y EE 0 ,BE2 co (X,Y) = EL (Y -m ) 
(X-mI)] =E(YX) 。 根 据 累 期 望 法 则 (公式 (2. 18)) ,由 于 ECYIX) =0,E(YX) =E[E(YI 
X)X] =0, 因 此 cov(Y,X) =0。 方 程 (2. 25) 是 通过 把 cov(Y,X) =0 代入 到 公式 (2. 23) 相 关 
系数 的 定义 中 得 到 的 。 如 果 久 和 了 的 均值 不 为 0, 那 么 , 先 要 减 去 它们 的 均值 ,然后 应 用 前 
面 的 证 明 。 

但 是 ,如 果 壮 和 了 是 不 相关 的 ,那么 绘 定 X 条件 下 了 的 条 件 均 秆 并 不 依赖 于 ,这 个 结 
论 就 不 一 定 成 立 了 。 换 名 话说 ,了 的 条 件 均值 可 以 是 的 函数 ,但 了 和 针 却 可 以 是 不 相关 
的 ,这 种 关系 是 可 能 的 。 在 练习 2. 19 中 给 出 了 一 个 这 样 的 例子 。 


2.3.5 ”随机 变量 和 的 均值 与 方差 
两 个 随机 变 其 与 工 的 和 的 均值 等 于 它们 的 均值 的 和 , 即 ， 


E(X +Y) =E(X) + E(Y) =px tiy (2.26) 
X 5 Y BJR105 225 ,等 于 它们 的 方差 的 和 ,加 上 它们 协 方差 的 2 倍 , 即 : 
Var( 发 + 了 ) =var( X) +var(Y) +2ceov( X F) =o} +G + 20y, (2.27) 
如 果 于 和 了 是 独立 的 ,那么 协 方差 为 0, 它 们 的 和 的 方差 等 于 它们 的 方差 的 和 , 即 ; 
var( X +Y) =var( X) +var(Y) =o} +a AR A R F RTA) (2.28) 


有 关 随 机 变量 加 权 和 的 均值 ,方差 以 及 协 方差 的 重要 表达 式 在 重要 概念 2 3 中 给 出 。 
重要 概念 2 3 中 结论 的 推导 在 附录 2. 1 中 给 出 。 


重要 概念 2. 3 


随机 变量 和 的 均值 , 方 姜 和 挫 方 状 
设 X, 了 和 为 随机 变量 , 设 pr 和 ox 为 的 均值 和 方差 ,ayy 为 六 和 Y 的 协 方差 (其 他 
变量 亦 如 此 ) ,并 设 a,8 和 < 为 常数 ,很 据 均 值 .方差 以 及 协 方 差 的 定义 ,可 以 得 到 如 下 公式 ; 


Eta +bX +cY) =a + buy + ony (2.29) 
var(a + bY) = Per? (2.30) 
var( aX + bY) =a) t +2aba yy + bos (2.31) 
K(Y2) =r; +m (2.32) 
cov(a + bX +cV,Y) = boyy + coyy (2.33) 
E(YY) = zy tuy (2.34) 


leor(X,Y)1<1 Morl Sy orzror( 相 关系 数 不 等 式 ) (2.35) 





经 济 计 基 学 中 最 涡 淹 到 的 概率 颁布 是 正 态 壬 布 , 卡 方 委 布 ,所 。 个 布 以 下 学 生 1 Ar 
241 正 态 谷 布 


HEM ES | normal djstrioutionl 的 连续 型 随机 变量 已 有 图 于 -3 dh iran Bp TL h g; 
的 概率 交 度 。 正 老 概 率 北 度 浮 数 的 县 休 数学 定义 在 附录 15. 1 hiyi, W 2—3 R, 
Wa EAEN a: ñ F 359808 8eu e 8122 pt Ef nra), EL 95% MIRET a - 1. 067 #la 
+1. 96r Z|. 





n = thir H n +| 9 = y 


Heit a H rt at ESE e t atr k PPA a Aha), 在 一 |r Ña 
le thE pdk Fh90O8S L 95. EER A (u, ha 
国正 毒 概 襄 密 应 

正 态 分 布 具 有 一 些 特定 的 记号 和 术语 。 拘 值 为 上 BJ hot 的 正 态 千 布 简 记 为 Nij. 
r's 标准 正 恋 分 布 | slandard normal distribution | EBA 0 H 335 3 1 WES, 
AMOI). WAMO DARATAN EGA Z Sd FE2 KE nAn p 
WREE. Piee Dle Ae 为 尖 数 ， 标 雁 正 态 累积 分 布 函 数 乓 值 天 在 附 表 1 da. 

要 计算 一 个 具有 一 般 均值 和 方 趟 的 正 壹 变 和 的 概率 , 必 频 首先 将 其 标 淮北 
(standardized) , BI tak P HHE WB. DG WR VIRAL YO) 6, 
BHV IRMLEJIS 1 HEFER WESH MA sl Big 3 R 32 bug. 即 图 2 一 41a) 中 
明 影 如 从 的 面积 是 毒 小 呢 ? 了 的 标 肘 化 距 式 就 是 站 泸 去 它 的 均值 后 再 除 以 官 前 标准 荔 , 即 


[7-1)449= 六 (7-1)。 因 此 ,随机 变量 上 (Y1) 服 从 均值 为 0. 方 执 为 1 的 正 索 分 布 ( 时 
绒 习 224); 它 其 有 围 2 一 4(b) 质 示 的 标准 正 杰 半 布 a 现在 ,站 志 2 FATH- l) < 于 (2 = 


LAY- ei e: 


E E E ET TE =(K 691 (2361) 


这 时 ,外 的 1 TUARA 1 中 查 查 。 


可 用 同样 的 扒 法 水 计算 正 过 分 布 的 随机 变量 大 于 某 个 值 的 概率 或 其 值 蔚 估 基 个 范围 内 
的 杠 率 ,在 重要 怀念 工 汪 中 总 早 了 这 些 步 村 ,在 后 面 的 信 租 杠 * 华 尔 街 档 糙 的 一 天 ”中 提供 
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i: AT HW Pri Fez) stik YERE A E a =l) HERG 
CHRD n Ia MAERT Y=2 Jm E a h) k T HAEE Y 
SERRE HANEM -12 是 个 标准 正 志 随 机 变 基 (加 RPs) =Pr( (Y — 
J22s(2-112 a Prl Z=, 5). HW eTM Pe 20.5) =b. 691, 

Mim HRH YA a e 的 慨 南 
[Ren 3-4 AW Waw HI, 
艺 元 正 吉 外 布 ， 正 态 分 布 可 稿 椎 广 束 描述 一 给 随机 变 重 的 联 间 分布; 这 种 分 布 外 称 为 
#£ = E ayga | multivariate normal distribution] , MR S em EW Hl2 aR S = t 
Emst (bivariate norma! distribution] 。 附 录 15.1 申 给 出 T iS in 8 ad E s 
PEREA FACERE hBi 了 了 一般 的 才 元 正 坦 他 布 的 概 这 密度 函 败 表达 式 。 

多 元 正 考分 布 具 有 三 个 重要 性 质 ， 

s aA r MANTEA TA TES N B a Aii ARREA aš +hY 也 
AETA 


nE AAE Ninay + ay le +y E E A e EB) 12.37) 
aii, mM a BUSH 3 G Fa. MR2 kusqaku Eee EAE ór 如 
官位 前 利 ) 志 部 服从 正 态 分 布 。 


镍 一 ,如果 一 组 变 基 都 融 从 多 元 正 坊 分 布 ,那么 ,每 个 变 莉 的 边 绍 分 布 也 都 是 正 考 的 
[这 个 绪论 可 通过 狂 公式 (231) 中 的 6=1 fü b =0 38933). 

第 三 , 姑 理 服从 多 元 正太 分布 的 变量 间 的 协 廊 其 都 为 0, 那 认 , 这 些 变 量 基 独立 的 。 因 
而 ,如 尝 半 和 了 服从 二 元 正太 并 布 且 ww =0,12 X fü Y Rl hq, 在 王 3 节 中 靖 述 了 各 


果 革 和 了 和 是 独立 的 ,那么 不 论 它们 的 联合 分 布 如 何 , 均 有 ww =0。 如 果 王 和 了 服从 联合 正 
态 分 布 ,那么 反 过 来 讲 世 成 立 。 这 个 结论 一 一 协 方差 为 0 隐 售 着 独立 性 一 一 是 多 元 正 态 分 
布 的 特殊 性 质 。 一 般 情况 下 ,这 个 结论 并 不 正确 。 


重要 概念 2.4 








正 态 随机 变量 概率 的 计算 
假设 了 服从 均值 为 jx HAES e 的 正 态 分 布 , 即 了 服从 N u) ,那么 通过 减 去 它 的 
均值 后 再 除 以 其 标准 差 , 妈 通过 计算 Z=( 了 -jx)/o 可 将 了 标准 化 。 
设 和 cs 为 两 个 常数 且 ce, <eo, HES dis (e -AMrd = (c, -Ar。 则 : 


Pri Y<e,) =Pr( Z<d,) = @(d,) (2.38) 
Pe(Yze ) =Pr(Zzd,) =1 - @( d, ) (2.39) 
Prie = Y=e,) =Pr(d &<Z=<d,) =@(d,) - @(d,) (2.40) 


HR 1 中 列 出 了 正 态 累积 分 布 函 妆 更 。 


2.4.2 RERA Fo a A 


在 统计 学 和 经 济 计 量 学 中 , 当 我 们 检验 某 类 假设 时 ,经 常会 用 到 卡 方 分 布 和 灰 , . A, 

卡 方 分 布 [chi-squareg distribution) £: m 个 独 空 的 标准 正 态 分 布 随机 变 基 的 平方 和 的 
分 布 。 这 个 分 布依 赖 于 m, HR m 为 卡 方 分 布 的 自由 度 。 例 如 ,假设 Z1 , 和 Z, 是 独立 的 
标准 正 态 随 机 变量 ,那么 ,Zi + 如 + 如 服从 自由 度 为 3 的 卡 方 分 布 。 这 个 分 布 的 名 称 来 自 
于 用 来 表示 它 的 希腊 字母 :自由 度 为 m 的 卡 方 分 布 表示 为 好 。 

附 表 3 给 出 了 分 布 的 部 分 百 分 位 数 。 例 如 , 附 表 3 RB T y, 分 布 的 第 95 个 百 分 位 
数 是 7.81 ,因此 ,Pr( 2 + Z} + Z781) =0.95。 

与 好 分 布 密切 相关 的 一 个 分 布 是 下, 分布 。FF, ,分布 ( Fn. distribution ) 就 是 自由 度 
为 m 的 卡 方 分 布 的 随机 变量 除 以 m 的 分 布 。 同 样 Fae 分 布 就 是 m 个 标准 正 态 随 机 变量 
平方 和 的 平均 数 的 分 布 。 例 如 ,如 果 Z. ,Z, 和 Z, 是 独立 的 标准 正 态 随机 变量 ,那么 , (21 + 
Zi +Z) 服从 下, 分布。 


一 般 兴 趣 框 





华尔街 粮 糕 的 一 天 

通常 ,在 美国 股票 市 场 交 易 的 股票 的 综合 价值 会 在 一 日 内 上 涨 或 下 跌 一 个 百分点 ,或 者 
更 多 。 这 是 通常 情况 , 它 根本 就 苑 法 和 1987 年 10 月 9 日 星期 一 那天 所 发 生 的 一 切 相 比 。 
在 这 个 “黑色 星期 一 ” , 道 ， 琼斯 工业 平均 指数 (30 种 大 的 工业 股票 的 平均 市 值 ) 下 跌 了 
25.6%! 从 1980 年 1 月 1 日 到 1987 年 10 月 16 日 , 道 氏 指数 日 收益 率 的 标准 差 ( 即日 价格 
变化 的 百分比 ) 是 1. 16% ,所 以 25. 6 入 的 下 跌幅 度 意味 着 22 (25. 671.16) 个 标准 差 的 贷 收 
益 。 这 次 巨 幅 的 下 啤 可 从 19 世纪 80 年 代 道 氏 指 数 的 日 收益 率 变化 图 中 看 出 ,如 图 2 一 5 
所 示 。 

如 果 股 票 收益 率 服 从 正 态 分 布 ,那么 至 少 下 路 22 个 标准 差 的 概率 是 Pr( Z = -22) = 
@&( -22) 。 在 附 表 1 中 找 不 到 这 个 值 ,但 你 可 专利 用 计算 机 来 计算 { 试 一 试 )。 这 个 概率 等 
T LAx10 7 ,也 就 是 0.000…00014 ,小 数 点 后 共有 106 个 “0”! 














自分 比 变化 
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1987.10.19 
—. 


-30 L L. A a) 
1980 1981 [982 1983 1984 1985 1986 1987 1988 1989 1990 
年 份 
注 :在 加 世纪 0 年 由 期 闻 ,“ 道 氏 " 指 数 的 日 百分比 平均 变化 是 0.05 免 , 它 的 标准 着 是 1.16%。 在 
1987 年 10 月 19 日 一 一 "景色 尾 期 一 ”,“ 道 民 ” 指 数 下 赎 了 25.6% ,或 超过 了 22 个 标 淮 差 。 
图 2--5 加 世纪 80 年 民 道 :琼斯 工业 平均 指数 的 日 百 分 比 骞 化 


4 x10~ 中 这 个 数 究 况 有 多 小 呢 ? 考虑 下 面 的 情形 : 
e 世界 人 口 大 约 有 的 亿 , 因 灶 在 所 有 活着 的 人 中 赢得 随机 彩票 的 概率 约 是 60 亿 分 之 
—B 2 < 10 7. 
* 人 们 认为 字 宙 已 经 存在 了 150 亿 年 或 大 约 $ x 107 秒 ,所 以 从 字 宙 开始 之 时 起 随机 地 
选 定 其 中 一 秒 的 概率 是 2x10"。 
s 在 地 球 表 面 1 公里 的 大 气 内 约 有 10” 个 分 子 , 随机 好 选择 一 个 分 子 的 概率 等 于 
10 -43 a . 
尽管 华尔街 确实 经 历 了 最 糟糕 的 一 天 ,但 它 发 生 的 概率 只 不 过 是 1.4 x 107”. EBR 
上 , 朋 票 收益 率 服从 的 分 布 要 比 正 态 分 布 具有 更 厚 的 尾部 。 换 名 话说 ,与 正 态 分 布 所 预示 的 
不 同 ,在 一 些 日 子 里 可 能 存在 很 大 的 正 收益 ,而 在 男 一 些 日 子 里 可 能 存在 很 大 的 负 收 益 。 我 
们 在 第 14 章 中 提出 了 一 个 常 被 金融 专家 使 用 的 股票 收益 率 的 经 济 计量 模型 , 它 与 我 们 在 此 
尔 街 上 实际 看 到 的 非常 好 的 或 非常 糟糕 的 吓 子 更 加 一 致 。 
附 表 4 给 出 了 F, 分布 的 部 分 百 分 位 数 。 例 如 ,请 .分 布 的 第 95 个 百 分 位 数 是 2. 60， 
RE, Pri (Zi +Z; +Z;)/3=<2,60] =0.95。F,。 分 布 的 第 95 个 百 分 位 数 是 x 分 布 的 第 95 
个 百 分 位 数 除 以 37.8173 =2.60)。 








(2.31) ,其 中 ,a =b = eo (Y,,F,) =0) ,rar( 习 = 六 oj。 对 宁 一 般 的 ,由于 区 ,四 是 
独立 同 分 布 的 ,对 于 ij,Y, 与 了 是 独立 分 布 的 ,因此 cov( Y,,Y,) =0。 所 以 : 
var( Y) =va(-- y Y.) 





-4 Y var( Y.) +7 Y Y oY Y) (2.43) 
2 41 
Th 
Y EZEN AR ERR, El oyna 
综 上 所 述 ,了 的 均值 .方差 和 标准 差分 判 为 ; 

E(Y) =py (2.44) 
var(Y) =a} (2.45) 
std. dev( F0 sos% (2.46) 


不 论 了 的 分 布 形式 如 何 , 上 面 的 结论 都 成 立 。 也 就 是 说 ,要 使 公式 (2.44)、 公 式 
(2 45) 和 公式 (2. 46) 成 立 ,并 不 要 求 工 的 分 布 权 某 种 特定 的 形式 ,比如 说 正 态 分 布 。 

符号 o3 表示 样本 均值 了 的 抽样 分 布 的 方差 。 相 反 ,o? 是 每 个 个 体 7, A, 
取 观 测 值 的 总 体 分 布 的 方差 。 同 样 ,符号 os 表示 了 抽样 分 布 的 标准 差 。 

当 了 服从 正 态 分 布 时 ,了 的 抽样 分 布 。 假 定 了 … Y, 是 采用 独立 同 分 布 抽样 方法 从 总 
IK Ny,02) 中 抽取 的 。 和 根据 公式 {2.37),n 个 服从 正 态 分 布 的 随机 变量 的 和 也 服从 正 态 
分 布 。 由 于 了 的 均值 是 六 ，, 且 了 的 方差 为 oy/n, 这 意味 著 , 如 果 五,…, 是 采用 独立 同 分 
布 抽样 方法 从 Niro) PRIRA, IRA YERA N ayain) o 


[2.6_ 抽样 分 布 的 大 样本 通 近 : 


抽样 分 布 在 统计 学 和 经 济 计量 学 方法 的 发 展 中 发 挥 了 重要 作用 ,因此 在 数学 意义 上 理 
解 了 的 抽样 分 布 的 含义 是 非常 重要 的 。 刻 画 抽 样 分 布 有 两 种 方法 :一 种 是 “精确 "方法 ,为 
一 种 是 “逼近 ”方法 。 

“精确 "方法 要 求 推导 出 对 任意 的 = 值 都 成 立 的 抽样 分 布 表达 式 。 对 任意 的 ,精确 描 
述 了 分 布 的 抽样 分 布 被 称 为 了 的 精确 分 布 (exact distribution) 或 有 限 样本 分 布 (finite 一 
sample distribution) 。 例 如 ,如 果 了 服从 正 态 分 布 ,而 且 了 ,…, 卫 是 独立 同 分 布 的 ,那么 
[如 同 2. 5 节 中 所 讨论 的 ) ,了 的 精确 分 布 是 均值 为 ar 且 方 差 为 gy/n 的 正 态 分 布 。 但 是 ,如 
果 了 不 服从 正 态 分 布 , 那 么 一 般 而 言 茸 的 精确 抽样 分 布 是 非常 复杂 的 ,并 且 取 决 于 工 的 
分 布 。 

这 里 的 “ 通 近 ”方法 ,应 用 了 依赖 于 大 样本 容量 的 抽样 分 布 的 带 近 理论 。 抽 样 分 布 的 大 
样本 逼近 通常 被 称 为 渐 近 分 布 {asymptotic distribution) 。 之 所 以 称 之 为 “ 渐 近 的 ” ,是 因为 
这 种 逼近 在 noo 的 极限 处 是 精确 的 。 正 如 我 们 在 本 节 中 所 看 到 的 ,这 些 有 逼近 会 是 非常 准 
确 的 ,即使 样本 容量 只 是 n=30 个 观测 值 。 由 于 实际 中 经 济 计量 学 所 使 用 的 样本 容量 通常 
是 数 以 百 计 或 千 计 的 ,因此 ,能 够 依靠 这 些 渐 近 分 布 为 精确 抽样 分 布 提 供 非常 好 的 逼近 。 

本 节 介 绍 当 样 本 容量 很 大 时 用 来 进行 逼近 抽样 分 布 的 两 个 重要 工具 :大 数 定律 和 中 心 














极限 定理 。 大 数 定律 表明 , 当 样本 容量 很 大 时 ,了 将 会 以 非常 高 的 概率 接近 于 jx,。 中 心 极限 
定理 表明 , 当 样 本 容量 很 大 时 ,标准 化 的 样 个 均值 (了 -py)/or 的 抽样 分 布 是 渐 近 正 态 
分 布 。 

虽然 精确 的 抽样 分 布 是 复杂 的 ,而 且 依 赖 于 了 的 分 布 , 但 是 渐 近 分 布 是 简单 的 。 此 外 ， 
值得 注意 的 是 ,(Y-Ay )very 的 渐 近 正 态 分 布 并 不 依赖 于 工 的 分 布 。 这 个 正 态 渐 近 分 布 提 
供 了 航 大 的 简化 ,并 成 为 全 书 所 使 用 的 回归 理论 的 基础 。 


2.6.1 大 数 定律 与 一 致 性 


大 数 定律 {law of large numbers) 指出 ,在 一 般 条件 下 , 当 n 很 大 时 ,了 将 会 以 非常 高 的 
概率 接近 于 jy。 大 数 定 律 有 时 被 称 为 "均值 定律 ”。 当 把 大 量 的 均 慎 相同 的 随机 变量 放 在 
一 起 联 平 均 数 时 ,大 的 数值 平衡 了 小 的 数值 ,而 且 它 们 的 样本 均 秆 接近 于 它们 的 共同 均值 。 

例如 ,考虑 我 们 的 学 生 通 勤 实验 的 一 种 简单 情况 ,实验 里 她 只 记录 下 她 的 通勤 时 间 是 短 
的 ( 少 于 20 分 钟 ) 还 是 长 的 。 如 果 她 在 第 ;个 随机 选择 的 日 子 中 的 通勤 时 间 短 BB $ Y. = 
1 ;如 果 道 勤 时 间 长 ,那么 了 =0。 因 为 她 使 用 简单 随机 抽样 ,所 以 YV... V. 是 独立 同 分 布 
的 。 因 此 ,了 (i=1,…,n) 是 贝 努 里 随机 变量 的 独立 同 分 布 抽样 ,这 里 ( 见 表 2 一 2)Y =1 的 
概率 是 0.78。 由 于 中 努 里 随机 变量 的 期 望 是 它 的 成 功 概率 ,因此 ,ECF )=jpy =0.78。 样 本 
均值 了 就 是 她 的 样本 中 通勤 时 间 短 的 日 子 的 比例 。 

图 2 一 6 显示 了 各 种 不 同样 本 容量 条 件 下 的 了 的 抽样 分 布 。 当 n=2 时 ( 见 图 2-6 


(a)), 了 只 能 取 三 个 值 , 即 0,3% 1( 没 有 一 次 通勤 时 间 短 .一 次 通勤 时 间 短 和 两 次 通勤 时 


HRE) ,其 中 没有 一 个 特别 接近 总 体 的 真实 比例 0.78。 但 是 , 随 著 n 的 增 大 ( 见 图 2 一 6 
(b) 一 图 2 一 6(d) ) Y 取 更 多 的 值 ,抽样 分 布 紧 密 地 集中 在 jy 附近 。 

随 着 n 的 增 大 ,了 以 不 断 增 大 的 概率 接近 于 Ar 的 性 质 被 称 为 依 概率 收 化 {convergence 
in probability ) ,或 更 精确 地 被 称 为 一 至 性 {consistency} ( 见 重要 概念 2.6)}。 大 数 定 律 指 
出 ,在 一 定 条 件 下 ,了 依 概 率 收 化 于 jz ,或 者 说 ,7 与 jxy 是 一 致 的 。 

大 数 定律 的 条 件 ( 这 些 条 件 本 书 中 会 经 常用 到 ) 为 ,YC(i=1,-…,n) 是 独立 同 分 布 的 , 且 
了 的 方差 y 是 有 限 的 。 在 15.2 节 中 我 们 详细 阐述 了 这 些 条 件 的 数学 意义 ,并 证 明了 大 数 
定律 。 如 果 数 据 是 通过 简单 随机 抽样 方法 搜集 上 来 的 ,那么 独立 同 分 布 假设 就 会 成 立 。 方 
差 有 由 假设 说 明 ,极端 大 的 世 的 值 很 少 被 观测 到 ,和 否则 样本 均值 就 会 是 不 可 车 的 。 本 书 采 
用 的 这 个 假设 是 合理 的 。 例 如 ,学生 的 通勤 时 间 就 存在 一 个 上 限 { 如 果 交 通 竣 病 , 她 可 能 会 
停车 步行 ) ,因此 通勤 时 间 分 布 的 方差 是 有 限 的 。 


2. 6.2 中 心 极限 定理 


中 心 极限 定理 [ central limit theorem) 指出 ,在 一 般 条 件 下 , 当 n 较 大 时 ,了 的 分 布 可 充 
分 地 逼近 于 正 态 分 布 。 前 面 我 们 讲 过 ,了 的 均值 是 上 ,县 它 的 方差 是 o# =gy/n。 根 据 中 心 
极限 定理 , 当 n 很 大 时 ,了 的 分 布 近 似 服从 NCy,07)。 如 2.5 节 结 尾部 分 所 讨论 的 , 当 样 本 
从 正 态 分 布 总 体 NC,02) 中 被 随机 地 抽取 时 ,NCwy ,03) 就 是 了 的 精确 的 分 布 形式 。 中 心 
极限 定理 表明 , 当 值 很 大 时 ,即使 了 ，,…,Y, 本 身 并 不 服从 正 态 分 布 ,那么 ,这 个 结论 也 同 
样 是 近似 正确 的 。 

由 图 2 一 6 可 大 致 地 看 出 了 的 分 布 收 敛 于 钟 形 的 正 态 近似 。 不 过 ,对 于 大 的 = 值 , 由 于 
分 布 蛮 得 非常 紧 凌 ,需要 睁 大 眼睛 才能 看 得 清 。 如 果 使 用 放大 镜 或 利用 一 些 别 的 方法 放大 
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或 六 大半 中 的 横 华 标 轴 , 就 会 更 容易 地 看 出 了 的 分 布 形 状 。 


重要 概念 2.6 
惊 概 军 收效 ,一致 性 和 大 数 定 律 
对 于 尾音 的 需 数 c>0, 随 n AAR dink FiFi =pr+0) 区 城内 的 最 率 任 意 地 技 
近 1, 那 么 ,我 们 就 说 样 此 均值 了 依 根 率 收 敦 于 jp (或 者 说 ,7 了 与 ky 是 一 臻 的), 记 为 
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mi— 好 自 于 一 个 有 习 疗 布 的 = 个 抽 树 的 标准 化 樟 本 均值 的 分 布 

中 心慌 恨 定理 是 个 重要 的 结论 。 当 程 小 时 ,图 2 一 7 ,图 2 一 8(b) 和 图 2 一 8(e) 中 了 的 
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Fñ. JER RRAIN. MPH n A, P 的 分 布 接近 于 正 吉 分布, 因此 了 了 欧 分 布 被 
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中 心 裤 限 定理 的 作用 和 正 态 近似 的 方便 性 ,使 得 它们 的 理论 很 容易 与 现实 的 广泛 应 用 
相 结 合 ,从 而 使 它们 成 为 了 现代 应 用 统计 学 的 重要 基础 。 中 心 极 思 定理 要 点 的 总 结 在 重要 
概念 2.7 中 给 出 。 


重要 概念 2.7 





中 心 极限 定理 
BEF.. r, 是 独立 同 分 布 的 , 昌 巡 (了 ) =suy,var( Y.) seih RPO cryn na 
w, (了 -pr)/os( 其 中 ,0 =g2/n) 的 分 布 会 被 标准 正 态 分 布 很 好 地 近似 蔡 代 。 


总 结 - 


1、 随 机 变 重 取 不 同 值 时 的 概率 ,由 累积 分 布 函 数 .概率 分 布 函数 ( 对 于 离散 型 随机 变量 
而 言 ) 和 概率 密度 函数 ( 对 于 连 续 型 随机 变量 而 言 ) 来 描述 。 

2. 随机 变量 了 的 期 望 值 ( 也 称 为 它 的 均值 Ar) 是 它 的 概率 加 权 平 均值 ,表示 为 天 ( 芒 。 
Y 的 方差 是 cy = 瑟 了 -A) ] ,了 的 标准 差 是 其 方差 的 平方 根 。 

3 两 个 随机 变量 XX 和 了 的 联合 概率 由 它们 的 联合 概率 分 布 来 描述 。 给 定 X=x 条 件 下 
了 的 条 件 概率 分 布 ,就 是 以 羡 取 值 * 为 条 件 的 了 的 概率 分 布 。 

4. 正 态 分 布 的 随机 变量 具有 图 2 一 3 中 的 钟 形 的 概率 密度 曲线 。 要 计算 与 正 态 随机 变 
量 相 联系 的 概率 ,首先 要 将 变量 标准 化 ,然后 使 用 附 表 ! 中 烈 出 的 标准 正 态 累积 分 布 表 。 

5. 简单 随机 抽样 生成 "个 独立 同 分 布 (i i 9 ) 的 随机 观测 值 六,…,Y,。 

6， 样 本 均值 了 随 着 被 随机 选择 的 样本 的 变化 而 变化 ,因而 它 是 个 具有 抽样 分 布 特 征 的 
随机 变量 。 如 果 Y a... Y. 是 独立 同 分 布 的 ,那么 : 

a. 了 的 抽样 分 布 均值 为 jy, 方差 为 gf = yn 

b. 大 数 定律 表明 ,了 依 概 率 收敛 于 吕 y; 

c 中 心 极 限定 理 表明 ,了 的 标准 化 形式 (了 -uor E n BRAN, RAEES 
{NN(0,1) 分 布 ) 。 


-重要 术语 


结果 概率 ”样本 空间 事件 ”离散 型 随机 变量 ”连续 型 随机 变量 概率 分 布 
紧 积 概率 分 布 ”累积 分 布 函数 (c. d f.) ”内 努 里 随机 变量 。 贝 努 里 分 布 ”概率 密度 函数 
(p. d. f) 密度 函数 ”密度 期望值 均值 方差 标准 差 分 布 的 矩 联合 概率 分 布 
边缘 概率 分 布 条 件 分 布 条 件 期 望 条 件 均值 累 期 望 法 则 ”条件 方 差 独立 性 协 方 
差 和 相关 性 不 相关 的 ” 正 态 分 布 ”标准 正 态 分 布 标准 化 变量 多 元 正 态 分 布 ”二 元 正 
态 分 布 “ 卡 方 分 布 “ 书 ,。 分 布 学 生 t 分 布 简单 随机 抽样 ”标准 化 随机 变量 总 体 E 
分 布 的 ”独立 同 分 布 (i id) 抽样 分 布 ”精确 分 布 渐 近 分 布 ”大 数 定律 ” 依 松 率 收敛 
一 致 性 ”中心 极 限定 理 戎 近 正 态 分 布 





[复习 概念 ] 
2.1 本 章 中 用 到 的 随机 变量 的 例子 包括 :(a) 你 过 到 的 下 一 个 陌生 人 的 性 别 ;(b) 电 脑 


有 死机 次 数 :(e) 通 勤 到 学 校花 费 的 时 间 ;(d) 你 在 图 书馆 被 指定 使 用 的 电脑 是 新 的 还 是 旧 的 ; 
(e) 是 否 下 两 。 请 解释 为 什么 每 一 个 变量 都 可 以 被 看 做 是 随机 的 。 

2.2 假定 随机 变量 半 和 7 是 独立 的 ,并 且 知 道 它们 的 分 布 。 请 解释 为 什么 知道 下 的 
值 但 不 会 因而 知道 任何 关于 Y 值 的 信息 。 

2.3 设 飞 表示 你 的 家 乡 在 革 个 给 定 月 份 中 的 降雨 量 , 了 表示 同一 月 份 洛杉矶 出 生 的 婴 
儿 数 。 请问 :了 和 了 是 相互 独立 的 吗 ? 请 给 予 说 明 。 

24 一 个 经 济 计量 学 课程 的 班级 里 有 80 名 学 生 ,这 些 学 生 的 平均 体重 是 145 磅 ,从 这 
个 班级 中 随机 选择 4 名 学 生 作 为 样本 ,并 计算 出 他 们 的 平均 体重 。 在 这 个 样本 中 ,学 生 的 平 
均 体 重 会 等 于 145 R? 如果 会 ,为 什么 ?如 果 不 会 ,为 什么 ”结合 这 个 例子 解释 为 什么 样 
本 均值 了 是 个 随机 灾 量 。 

25 BE Y. Y. 是 独立 同 分 布 的 随机 变量 ,服从 NW(1,4) 分 布 。 绘 制 当 n=2 时 了 
的 概率 密度 草图 。 当 n=10 和 n=100 时 重复 这 一 过 程 。 用 语言 描述 这 些 概 率 密度 的 差别 。 
你 的 答案 和 大 数 定律 之 间 有 什么 关系 吗 ? 

26 RE Y, y, 是 独立 同 分 布 的 随机 变量 ,服从 图 2 一 8 (a) 中 给 出 的 概率 分 布 , 现 
在 你 想 要 计算 Pr( 了 <0. 1)。 如 果 n =5, 使 用 正 态 近似 合理 吗 ? WH3E n =25 Hë a =100 呢 ? 
请 给 予 解释 和 说 明 。 





r 练 习 - 


带 " * "号 的 练习 题 的 答案 可 以 在 网 址 www. aw. comystock_watson EREI. 

“2.1 使 用 表 2 一 2 中 纵 出 的 概率 分 布 计算 :(a) 8(Y) 和 ECX);(b)ar 和 or; (ec) oy 
#lcorr( X, Ps 

2.2 ”使 用 表 2 一 2 中 的 随机 变量 上 MY ERARE W =3 +6X A V = 
20 -7Y。 WHA: (a) E(W)I E(V);(b)oy fll ayle) opt cor W, V) o 

2.3 R2 给 出 了 根据 1990 年 美国 人 已 普查 得 出 的 就 业 或 失业 (正在 找 工作 ) 的 劳 
动 适 龄 人 口中 ,大 学 毕业 生 和 就 业 状况 之 间 的 联合 概率 分 布 数据 。 

#2—4 1990 年 25 — 64 宏 的 美国 人 口中 大 学 毕业 生 和 就 业 状况 的 联合 分 布 





大 业 ( 了 =0) 就 业 ( 了 = ]) 总 计 

非 大 学 毕业 生 (X =0) 0. 045 0.709 0.754 
KFE =L) 0. 005 0.241 0.246 
总 iF 0.050 0.950 1. 000 


`a 计算 五 (了 。 

b. 失业 率 是 劳动 力 中 失业 人 已 所 占 的 比例 。 证 明 失 业 率 等 于 1- 焉 六。 

`e. H E E(YIX=1)#m ECYIX=0), 

d. 分 别 计算 大 学 毕业 生 种 非 大 学 毕业 生 的 失业 率 。 

`e 从 这 个 总 体 中 随机 选 出 一 个 人 人 ,而且 这 个 人 处 于 失业 状态 。 请 问 ;这 个 劳动 者 为 大 
学 毕业 生 的 概率 是 多 少 ? 为 非 太 学 毕业 生 的 概率 又 是 多 少 ? 

f 受 教育 程度 和 就 业 状况 之 间 是 独立 的 吗 ? 请 解释 理由 。 

2.4 ”随机 变量 了 的 均值 等 于 1, 方 差 等 于 4, 设 2Z=( 了 -1)/2。 WEH u =0,gz=1。 

25 计算 下 列 概率 ; 





=EN Y-m) 
= 人 os 
为 了 排 导 公式 (2. 31) ,我 们 仍然 利用 方差 的 定义 ; 
var(aX + bY} =E [aX + bY- (qa, +n) i 
=E [eX -p +b0(Y-a,)]1 
=Ele (X -p,) l +2E[eb(X-u,)(Y-a)] ELD (Y -py)’] (2.47) 
=a yar( X) +Zabeov( X,Y) + b`var( Y) 
zar, +2aborw +b os 
其 中 ,第 二 个 公式 是 通过 合并 同类 项 得 到 的 ;第 三 个 公式 是 通过 闷 开 二 次 项 得 到 的 ;第 四 个 
公式 是 根据 方差 及 协 方差 的 定义 得 到 的 。 
现在 推导 公式 (2. 32) 。 由 于 BY-A ) =0, 因 此 ; 
ECY?) 二 本 (了 了 一 Ar) + 下 | SEL (Y-n,) ] +2prE(Y -py) tur = oy +y 
为 了 推导 公式 (2.33) ,我 们 利用 协 方差 的 定义 ，; 
cov(a +bX+cV,V) =E|[a +bX+eV-E(a+bX+eV)])[Y- 4, 11 
=E[ WX -p ) tel V-d [F-a]: 
=E![b(X-p) LY -py]) + ElfelV -pr)][Y -py]| 
= mr +G, v 
boXY +eco VY 就 是 公式 (2. 33)， 
现在 我 们 推导 公式 (2. 34)。 
ECXY) sE||(X-uzl +a lL CY -pr) tay]1 
=E[(X-a,)(Y-ny)] +u EC Y-uy) +g E(X- x) 二 Re 
=G 二 RH 
现在 ,我 们 来 证 明 公 式 {2.35) 中 相关 系数 的 不 等 式 , 即 | cor (X,Y)! 和 1。 设 
a= -00y/o ,b=1, 应 用 公式 (2.31) , 则 : 


var( aX + Y) =a g} +0} +2acy, 





(2.48) 


=( uo) toy -2( -ay Trn (2.49) 
= -Ty 
内 为 varlat DETE, E Kul fe E A g, Br l H 2: (2.49) rh b5jk i —+#rul 3, 
0? -jy/od 尖 0 重新 整理 这 个 不 等 式 ,得 到 ; 
oaser 《 协 方差 不 等 式 ) (2. 50) 
这 个 协 方差 不 等 式 意味 着 onlo) <1 ,或 者 说 ,1oxyw/(oxay) 1<<1, 这 (利用 相关 系 
数 的 定义 ) 就 证 明了 相关 系数 不 等 式 |cor( Y, lei, 
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统计 学 是 利用 数据 来 了 解 我 们 身边 世界 的 一 门 学 科 。 统计 学 的 工具 可 以 帮助 我 们 知晓 
我 们 感光 趣 的 总 体 分 布 的 未 知 特征 。 例 如 , 刚 毕 业 的 大 学 生 的 收入 分 布 的 均值 是 多 少 ? 男 
性 职工 和 女性 职工 的 平均 收入 是 否 有 差别 ? 如 果 有 ,差别 是 多 大 ? 

这 些 问 题 与 劳动 者 总 体 收 入 的 分 布 有 关 。 回 答 这 些 问题 的 一 个 方法 是 对 劳动 者 总 体 进 
行 一 次 彻底 的 调查 ,记录 每 个 劳动 省 的 收入 ,进而 得到 收入 的 总 体 分 布 。 但 实际 上 ,这样 的 
全 面 调查 是 和 裤 其 品 责 的 。 美 国 惟一 的 一 个 全 面 调查 是 10 年 一 度 的 人 口 普查 。 仅 2000 年 的 
美国 人 器 普查 就 耗资 100 亿美 元 ,说 计 普 查 表 、 进 行 管理 和 实施 调查 、 收 集 与 分 析 数 据 的 过 
程 就 花费 了 10 年 时 间 。 尽 管 付 出 了 如 此 大 的 努力 ,还 是 有 许多 人 已 被 遗漏 ,没有 被 调查 - 
因此 我 们 需要 一 种 不 同 的 ,更 实用 的 方法 。 

统计 学 的 一 个 重要 观点 是 人 们 能 够 通过 对 从 总 体 中 选择 随机 祥 本 的 认识 来 了 解 总 体 的 
分 布 情况 。 比 如 ,不 用 调查 美国 人 口 总 体 , 我 们 只 需 通 过 简单 随机 抽样 的 方法 从 总 体 人 口中 
随机 选择 一 部 分 个 体 , 如 1 000 人 ,然后 利用 统计 方法 通过 对 这 个 样本 进行 分 析 , 我 们 就 可 
以 得 到 关于 整个 总 体 特 征 的 试验 性 结论 , 即 进行 统计 推断 。 

有 三 种 统计 方法 在 整个 经 济 计 量 学 中 被 普遍 使 用 , 即 估计 方法 .假设 检验 方法 和 置信 区 
间 方 法 。 所 谓 居 计 方 法 ,就 是 从 样本 数据 中 计算 出 总 体 分 布 未 知 特征 的 "最 佳 猜 测 值 ,如 
桩 本 的 均值 。 假 设 检 验 疗 法 ,需要 提出 一 个 关于 总 体 特征 的 特定 的 假设 ,然后 利用 样本 证 据 
判定 它 是 否 是 真 的 。 置 信和 区 间 方 法 ,是 用 一 组 样本 数据 估计 未 知 总体 特 征 的 某 一 区 间或 范 
围 。 在 第 3.1 节 、 第 3.2 节 和 第 3.3 节 中 复习 了 关于 未 知 总 体 均值 统计 推断 的 参数 估计 、 假 
设 检 验 和 置信 和 区间。 

经 济 学 中 许多 令 人 感 兴趣 的 问题 ,都 涉及 两 个 或 两 个 以 上 变量 之 间 的 关系 或 不 同 总 体 
之 间 的 比较 。 例 如 , 刚 华 业 的 大 学 生 中 男女 平均 妆 入 之 间 是 否 存 在 差异 ? 第 3.1 W 3 $ 
3.3 节 中 介绍 的 单个 总 体 均 值 估 计 的 方法 ,被 推广 应 用 到 比较 两 个 不 同 总 体 的 均值 ,这 部 分 
内 容 在 第 3,4 节 介绍 。 第 3.5 节 则 应 用 这 些 方 法 ,研究 了 男女 大学 毕业 生 收 入 之 间 的 “性别 
差异 ”的 证 据 。 第 3.6 节 以 样本 相关 关系 和 散 点 图 的 讨论 作为 本 章 的 钻 束 。 





3.1 总 体 均值 的 估计 


假如 你 想 知道 一 个 总 体 了 的 均值 xy ,如 刚 毕 业 的 女 大 学 生 的 平均 收入 ,那么 ,合计 这 个 
均值 的 一 个 很 自然 的 方法 ,就 是 从 5 个 独立 间 分 布 (i. i d. ) 的 样本 观测 值 Y... Y, 中 计算 
样本 的 平均 值 了 ( 以 前 我 们 讲 过 ,如 果 y... ,是 通过 简单 随机 抽样 方法 获得 的 ,那么 它们 
就 是 独立 同 分 布 的 ) 。 这 一 节 我 们 讨论 wy 的 合计 和 作为 ur 估计 量 的 了 的 一 些 性 质 。 


3.1.1 估计 量 及 其 性 质 

仙 计 号” 用 样本 平均 值 了 估计 jy 是 一 种 很 自然 的 方法 ,但 它 不 是 惟一 的 方法 。 例 如 ， 
另 一 种 个 计 a, 的 方法 是 简单 地 用 第 一 个 观测 值 Y, 来 估计 。 了 和 Y, 都 是 设计 用 来 估计 
的 数据 的 函数 ,根据 重要 概念 3. 1 中 术语 的 解释 ,二 者 都 是 pr 的 估计 量 。 当 我 们 用 重复 抽 


样 的 方法 估计 其 值 时 ,了 和 Y, 的 值 会 因 样 本 不 辐 而 不 同 {它们 产生 不 同 的 生计 值 )。 因 此 ， 
HEYA Y 都 具有 抽样 分 布 。 实 际 上 ,py 有 很 多 个 估计 量 ,了 AMY, 只 是 其 中 的 两 个 。 


重要 概念 3. 1 





估计 量 和 估计 值 

估计 量 {estimator) 是 从 总 体 中 随机 抽取 的 样本 数据 的 郴 数 。 估 计 值 (estimatej EA 
用 特定 样本 数据 实际 计算 出 的 佑 计量 的 数值 。 由 于 样本 选择 具有 随机 性 ,因此 估计 量 也 是 
随机 变量 ,而 佑 计 值 是 非 随机 的 数值 。 

由 于 有 很 多 个 可 能 的 估计 量 ,因此 ,怎样 判定 一 个 佑 计量“ 好 ”于 另 一 个 估计 量 呢 ? H 
为 估计 量 是 随机 变量 ,所 以 ,这 个 问题 也 可 以 次 为 精确 地 表述 为 :估计 量 的 抽样 分 布 的 理想 
特征 是 件 么 ? 一 般 地 说 ,我 们 希望 估计 量 至 少 在 平均 意义 上 尽 可 能 地 逼近 未 知 的 真 值 , 换 名 
话说 ,我 们 希望 估计 量 的 抽样 分 布 尽 可 能 紧密 地 集中 在 未 知 值 的 周围 。 基 于 这 种 理解 ,我 们 
引出 了 咎 计量 的 三 个 特定 的 理想 性 质 :无 偏 性 ( 缺少 偏差 ) 一 致 性 和 有 效 性 。 

丘 偏 性 “假设 你 通过 重复 随机 抽样 多 次 计算 佑 计量 的 值 ,那么 ,在 平均 的 意义 上 你 希望 
能 够 得 到 你 所 要 求 得 到 的 答案 ,这 种 希望 是 合理 的 。 因 此 ,估计 量 的 一 个 理想 性 质 就 是 它 的 
抽样 分 布 的 均值 等 于 yy ,如果 是 这 样 的 话 , 估 计量 就 是 无 偏 的 。 

用 数学 语 诗 来 表述 , 设 应 , 表示 jy HEEE MYR Fo WME EG) ==, ,那么 , 信 
计量 户 EARR IE E) E ir 的 抽样 分 布 均值 ;否则 ,ky 是 有 偏 的 。 

AE WHE p 的 另 一 个 理想 性 质 是 , 当 样本 容量 很 大 时 ,由 样本 的 随机 变化 所 引 
起 的 jy 值 的 不 确定 性 很 小 。 更 确切 地 讲 ,zy 的 理想 性 质 是 , 当 样本 容量 增 大 时 , 它 在 真 值 
pr 附近 很 小 区 间 内 的 概率 接近 于 1. B iy 对 ur 是 一 致 的 ( 见 重 要 概念 2.6) 。 

方 益 与 有 效 性 ”假如 你 有 两 个 备 选 的 估计 量 总 , 和 六 y, 而 且 它 们 都 是 元 偏 的 ,那么 ,你 
如 何在 它们 之 间 做 出 选择 呢 ? 一 种 方法 就 是 选择 抽样 分 布 最 密集 的 估计 量 , 也 就 是 说 ,在 
by Alir 之 间 选 择 方差 最 小 的 那个 估计 量 。 如 果 Ar 的 方差 比 产 的 方差 小 ,那么 称 hiy nr 
更 有 效 。“ 有 效 性 "这 个 术语 来 自 于 这 样 的 理解 ;如 果 户 的 方差 比 疡 的 方差 小 ,那么 说 明 
Bor E b, 更 有 效 地 利用 了 数据 中 的 信息 。 

篇 差 .一 致 性 和 有 效 性 的 总 结 在 重要 概念 3 2 rh. 














3. 1.2 了 的 性 质 

当 用 偏差, 一 致 性 和 有 效 性 这 三 个 准则 进行 判断 时 ,了 作为 的 估计 量 表现 如 何 呢 ? 

REM “ 致 卜 ”关于 了 的 抽样 分 布 ,我 们 已 经 在 第 2. 节 和 第 2.6 节 中 做 了 分 析 .在 
第 2.5 节 中 已 经 证 明 ,E(Y) =p ,因此 了 是 Ai 的 无 偏 估计 生 。 同 理 , 大 数 定律 ( 见 重要 概念 
2. 6) 结 果 表 明了 一 一 pr, 因 此 了 也 是 一 致 性 估计 量 。 

hati 了 的 有 效 性 怎么 样 呢 ? 由 于 有 效 性 要 求 对 估计 直 进 行 比较 ,内 此 ,我 们 需要 设 
定 与 了 相 比 较 的 一 个 或 几 个 合计 量 。 

我 们 完 从 比较 舍 计 其 了 , 和 了 的 有 效 性 开始 。 由 于 了,…, 了 , 是 独立 辣 分 布 的 ,7, 的 抽 
样 分 布 的 均值 是 ECY, ) =ar AI, Y, 是 jy 的 个 无 偏 估计 其。 它 的 方差 是 var(  ) = oj 
由 2.5 节 可 知 ,了 的 方差 等 于 03/a。 因 此 ,对 于 n>2, 了 的 方差 要 比 7 的 方差 小 ,也 就 是 说 ， 
了 是 个 比 Y, 更 有 效 的 佑 计量 。 所 以 ,根据 有 效 性 准则 ,应 访 用 了 代替 7。 显然 , 信 计 量 Y 
给 你 留 下 的 印象 是 个 较 差 估计 量 一 一 为 什么 你 要 特意 收集 = 个 观测 值 的 祥 本 却 只 保留 第 一 
个 观测 值 ,而 把 所 有 其 他 的 观测 值 舍弃 掉 呢 ?有效 性 概念 提供 了 一 种 正式 方法 证 明了 比 y. 
是 个 更 理想 的 估计 量 。 

一 个 不 太 明显 的 较 差 的 估计 量 的 情况 会 怎么 样 呢 ? 考虑 用 这 和 六 交替 作为 权重 对 观测 


值 进行 加 权 平 均 : 


+ (3.1) 


重要 概念 3.2 
偏差 .一 致 性 和 有 效 性 

Eps H hy 的 估计 量 , 那 么 ; 

m, 的 偏差 ( bias ) 为 E(jy) 一 此 Fo 

Mi Elir) =P ,那么 Ar 是 Ar 的 无 偏 估 计量 (unbiased estimator) 。 

Bi p, ur IA L, E z, 的 一 致 估计 是 (consistent estimator) 。 

Nilu, Eu, 的 另 一 个 估计 量 ,并 假设 癌 , Tü p, 都 是 无 偏 的 ,如 果 varlar) < var(jy)， 
JE SE zv E är 更 有 效 {efficient) 。 


为 了 计算 方便 ,这 里 假定 观测 期 数 为 偶数 。 了 的 均值 为 gy, 方差 为 1.2503An( 见 练习 
3.7) ,因而 ,了 是 无 偏 的 。 由 于 当 n 一 wm 时 ,var( 了 ) 一 0, 因 此 ,了 又 是 一 致 的 。 不 过 ,了 的 方差 
比 了 的 方差 大 ,所 以 了 比 了 更 有 效 。 

估计 量 了 ,Y, 和 上 具有 相同 的 数学 结构 :它们 都 是 Y... Y, 的 加 权 平 均 。 前 面 两 段 中 


的 比较 结果 表明 ,了 和 了 具有 比 了 更 大 的 方差 。 实 际 上 ,这 些 结论 反映 了 一 个 更 一 般 的 结 
果 江 是 了 ,…, 了 的 所 有 加 权 平 均 的 无 偏 估 计 寻 中 最 有 效 的 估计 量 。 该 结论 在 重要 概念 
3.3 中 进行 了 阐述 ,并 在 第 15 章 进行 了 证 明 。 

Y hu, JER | :于 全 计 晶 .样本 均 值 了 为 数据 提供 了 最 佳 拟 合 , 也 就 是 说 ,观测 值 和 了 
之 间 的 南方 差 是 所 有 可 能 估计 量 中 最 小 的 一 个 。 





t 


现在 我 们 考 申 使 下 式 的 值 为 最 小 时 估计 其 m 的 求解 问题 。 
> (Y. - m) (3.2) 


ERE m 和 也 有 样本 点 之 问 总 的 离 差 或 距离 平方 和 的 一 种 测 疫 。 HF m £ EY) 的 
— 不 估计 量 , 因 此 可 以 把 它 看 做 是 了 什 的 预测 。 这 样 就 可 以 把 离 荆 了 -m 看 做 是 预测 的 误 
差 。 KEAC. 2) 中 离 关 的 平方 和 可 以 被 看 做 是 预测 谋 差 的 平方 和 

使 表达 式 (3.2) 中 一 mm 的 离 差 平方 和 最 小 的 估计 量 m amha Atai Æ least 
squares estimator) - 可 以 用 反复 试验 的 方法 来 求解 这 个 最 小 二 乘 问题 : RME e m IE, 
次 到 你 找到 了 一 个 值 ,这 个 值 能 够 使 表述 式 (3.2) 的 值 尽 可 能 地 小 。 另 -一 种 方法 就 是 像 附 
录 3.2 中 所 描述 的 那样 ,利用 代数 或 微 积分 方法 来 证 明 选择 m = 了 能 够 使 表达 式 (3.2) 中 的 
离 差 平方 和 最 小 ,也 就 是 说 ,了 是 凡 的 最 小 二 乘 估计 量 。 


重要 概念 3.3 
了 的 有 效 性 


Ai Eu -MBEE Mi E Y Y, WPH Mirct Y = 了, 这 里 的 


G, |, t, BERVAR A, HWE Br 是 无 偏 的 ,那么 var( Y) < var( jiy) ,除非 My =Y. 也 就 是 
BE Yov ,了 ATE MOTA ERTE Y E jz， 最 有 效 的 佑 计量。 


3.1.3 ”随机 抽样 的 重要 性 


RDEZEE Y., o Y, 是 独立 同 分 布 的 抽样 样本 ,就 像 用 简单 随机 抽样 得 到 的 样本 一 
样 。 这 个 假定 是 非常 重 要 的 ,因为 丰 随 机 抽样 会 使 了 是 有 偏 的 。 候 设 为 了 估计 全 国 的 月 度 
Xk, 个 统计 机 构 采用 了 -种 抽样 方案 , 即 调查 人 员 每 月 第 二 个 星期 三 的 上 午 10 AH 
访问 旦 在 城市 公园 中 处 于 劳动 年 龄 的 成 年 人 。 由 于 这 时 大 多 数 在 岗 人 员 才 在 工作 (而 不 全 
SAAE) ,用 坐 在 公园 中 的 人 代表 失业 人 员 有 些 不 太 通 当 ,因此 ,基于 这 个 抽样 方案 的 
赤 业 率 的 估计 征 将 会 是 有 偏 的 。 这 个 偏差 产生 的 原因 在 于 这 个 抽样 方案 过 度 代表 了 或 过 度 
由 脾 了 总 体 中 的 失业 人 员 。 虽 然 这 个 例子 是 虚构 的 ,但 是 ,“ 兰 顿 获胜 "这 个 一 般 兴趣 棋 
给 出 的 由 不 完全 随机 抽样 所 引起 的 偏差 的 例子 却 是 真实 的 。 

设计 一 个 样本 选择 方案 ,以 偏差 最 小 为 准则 ,这 一 点 是 非常 重要 的 。 附 录 3.1 论述 了 
加 劳工 统计 局 在 实施 美国 当前 人 癌 调 查 (CPS) 时 的 实际 做 法 ,该 统计 局 就 是 用 这 种 调查 来 
估计 美国 月 度 失业 率 的 。 


一 般 兴 趣 框 





MR 

在 1936 EH NARAS 《文学 报 》 发 布 的 一 项 民意 调查 表明 ,阿尔 夫 ， 兰 顿 ( Al M. 
Landon} 会 以 57% 对 43% Ë! 鞋 倒 性 优势 击败 富兰克林 ° S H 38 ( Franklin D. Roosevelt) 。 
《文学 报 》 报 道 的 关于 选举 是 压倒 性 优势 这 一 结论 是 正确 的 ,但 是 关于 获胜 者 的 预测 却 是 错 
误 的 :罗斯 福 以 59% 对 和 1% 获胜 ! 

《文学 报 》 怎 么 会 犯 这 么 大 的 错误 呢 ? 《文学 报 》 的 样本 是 从 电话 记录 和 汽车 登记 文件 
中 选取 的 ,但 在 1936 年 ,许多 家 庭 还 没有 汽车 或 电话 ,那些 比较 富有 的 人 更 有 可 能 是 其 和 党 
人 ,由 于 电话 调查 并 没有 从 总 体 中 随机 地 抽样 而 是 偏 低地 抽取 了 民主 党 人 ,因此 佑 计量 是 








有 偏 的 ,从 而 令 《 文 学 报 》 犯 了 一 个 培 熔 的 错误 。 
你 认为 通过 因特网 进行 调查 会 产生 类 似 的 偏差 问题 玛 ? 


[3.2 ”关于 总 体 均 值 的 假设 检验 - 


许多 关于 我 们 身边 世界 的 假设 都 可 以 被 归结 为 是 或 否 的 问题 。 美 国 刚 毕 业 的 大 学 生 的 
平均 每 小 时 收入 等 于 20 美元 蚂 ? 男女 大 学 毕业 生 的 平均 收入 相等 吗 ? 这 两 个 问题 体现 了 
收入 总 体 分 布 的 特定 假设 。 统 计 学 面临 的 挑战 就 是 根据 样本 证 据 来 回答 这 些 问题 。 本 节 措 
述 了 总 体 均 值 的 检验 假设 [testing hypothesis ) (如 每 小 时 收入 的 总 体 均值 基 否 等 于 20 美 
元 ) 。 关 汗 两 个 总 体 的 假设 检验 (如 男女 平均 收 人 是否 相同 ) 将 在 第 3.4 节 中 介绍 。 


3.2.1 零 假设 和 备 择 假设 


统计 假设 检验 的 出 发 点 ,是 设 定 一 个 待 检 验 的 假设 ,这 个 假设 被 称 为 零 假 设 { null 
hypothesis) 。 假 设 检验 要 求 利 用 数据 来 比较 零 假设 和 另 一 个 恨 设 , 这 个 假设 被 称 为 备 择 假 
ig( alternative hypothesis) 。 如 果 零 假设 不 成 立 ,那么 备 择 假 设 就 成 立 。 
老 假 设 是 总 体 均 秆 5( 了 Y) 取 一 个 特定 的 值 , 记 为 xyoo。 零 假设 用 所 表示 ,因此 : 
H;:E(Y) =pro (3.3) 
例如 ,关于 总 体 均 值 的 推测 一 “大 学 毕业 生 每 小 时 挣 20 美元 " 便 构成 了 每 小 时 收 人 
总 体 分 布 的 零 假设 。 用 数学 语言 表达 ,如 果 Y 是 随机 选择 的 刚 毕业 大 学 生 的 每 小 时 收入 ， 
那么 零 假设 就 是 ECY) =20, 妈 公式 (3.3) 中 的 jyo =20。 
备 择 假设 设 定 了 当 零 假设 不 止 确 时 的 真实 情况 。 备 择 假 设 最 一 般 的 形式 是 EQ Y) = 
mp, 这 被 称 为 双边 备 择 假 设 {two-sided alternative hypothesis} , 因为 它 允 许 E( Y) 小 于 或 
大 于 jroo。 双边 备 择 假 设 可 写 为 : 
HEY) #4yo 【双边 备 择 假设 ) (3.4) 
单 过 备 择 假 设 也 是 可 能 的 ,相关 的 内 容 将 在 本 节 的 后 面 进行 讨论 。 
统计 学 家 面 对 的 问题 是 :利用 随机 选择 的 样本 数据 中 的 证 据 来 判定 ,是 接受 零 假 设 页， 
还 是 拒绝 零 假设 ,进而 接受 备 择 假设 HL。 如 果 零 假设 被 "接受 " ,这 并 不 意味 着 统计 学 家 宣 
布 了 法 假设 是 真 的 ,而 是 应 该 这 样 来 理解 , 即 在 当前 的 证 据 下 我 们 只 好 接受 它 ,但 是 随 着 以 
后 更 多 的 证 据 被 提供 , 零 假设 也 可 能 被 拒绝 。 因 为 这 个 原因 ,统计 假设 检验 可 被 归结 为 :要 
么 拒绝 零 假设 ,要 么 不 能 拒绝 零 假设 。 


3.2.2 př 


在 任意 给 定 的 样本 中 ,样本 均值 了 很 少 会 恰好 等 于 所 假设 的 值 kro。 实 际 上 ,了 和 As 
之 间 的 差异 可 能 是 由 真实 均值 并 不 等 于 jy。( 零 假设 是 假 的 ) 所 引起 的 ,也 可 能 是 由 虽然 真 
实 均 值 等 于 jy。( 零 假设 是 真 的 ) 但 因 随机 抽样 使 得 了 不 等 于 yr.o 所 引起 的 。 要 确切 地 区 分 
这 两 种 可 能 性 是 不 可 能 的 。 虽 然 样本 数据 不 能 提供 零 假设 的 结论 性 证 据 ,但 是 进行 概率 计 
算 却 是 可 能 的 ,这 种 概率 计算 允许 以 解释 抽样 不 确定 性 的 方式 来 检验 零 假 设 。 这 个 计算 涉 
及 用 数据 来 计算 零 假 设 的 p 值 。 

Dp 值 (p-value) ,又 称 为 显著 性 概率 [ significance probability) ,是 在 假定 零 假设 正确 的 
情况 下 ,你 抽 到 了 一 个 就 像 你 从 样本 中 实际 计算 出 来 的 那个 至 少 和 零 假设 相 背 离 的 一 个 统 








计生 的 概率 。 在 我 们 眼前 的 合子 中 ,p 值 是 在 零 假 设 下 抽 到 的 了 在 其 分 布 的 昆 部 至 少 和 实 
际 计算 的 样本 均值 一 样 远 的 概率 。 

例如 ,假设 在 刚 毕 业 的 大 学 生 的 样本 中 ,平均 工资 是 22. 24 美元 。yp 值 就 是 当 零 假设 为 
真 果 ,观测 到 一 个 了 的 值 至 少 和 由 纯 随 机 抽样 变化 得 到 的 观测 值 22. 24 美元 一 样 不 同 于 20 
美元 ({ 罕 假 设 下 的 总 体 均 值 ) 的 概 举 。 如果 这 个 p 值 很 小 ,比如 说 0.5% ,那么 在 零 假设 为 真 
的 条 件 下 抽 到 这 个 样本 是 不 太 可 能 的 ,因而 ,得 出 零 假设 确实 不 正确 的 结论 是 合理 的 。 男 一 
方面 ,如 果 这 个 p 值 很 大 ,比如 说 40% ,那么 在 零 假设 为 真 的 条 件 下 ,观测 的 样本 平均 值 
22. 24 美元 可 能 正好 是 由 随机 抽样 变化 所 引起 的 ,这 是 非常 可 能 的 ,因而 在 这 个 概率 意义 下 
拒绝 和 零 假设 的 证 据 很 弱 , 也 就 是 说 不 拒绝 零 假设 是 合理 的 。 

现在 我 们 用 数学 语言 来 表达 p 值 的 定义 。 设 产 ' 为 用 我 们 手边 的 样本 数据 集 实际 计算 
的 样本 平均 值 , 并 设 Pr 表示 在 零 假设 下 所 计算 的 概率 { 即 在 假设 ECY) =Aro 下 所 计算 的 
概率 ) |P HA: 

p IE = Pryl IY- pyol >Y -pr0l] (3.5) 

即 p 值 是 零 假设 下 在 了 分 布 的 尾部 中 超出 | Y” -uro | 的 面积 。 如 果 p 值 很 人 ,那么 观测 
值 六 与 零 假设 - 致 ,但 如 果 p 值 很 小 ,YY 与 零 假设 就 不 一 致 。 

为 了 计算 p 值 ,必须 要 知道 在 零 假设 下 了 的 抽样 分 布 。 如 2.6 节 中 所 讨论 的 , 当 样本 容 
量 很 小 时 ,这 个 分 布 是 复杂 的 。 不 过 ,根据 中 心 极限 定理 , 当 样 本 容量 很 大 时 ,了 的 抽样 分 布 
可 以 非常 好 地 被 正 态 分 布 近 似 地 表达 。 在 零 假设 下 ,这 个 正 态 分 布 的 均值 是 zy ,所 以 在 零 
假设 下 了 服从 分 布 N(jpeyo o$) ,这 里 ot =a?An。 只 要 样本 容量 充分 地 大 ,这 个 大 样本 的 正 
态 近似 使 得 在 不 需要 知道 了 的 总 体 分 布 的 情况 下 计算 p 值 成 为 可 能 。 但 计算 的 细节 依赖 于 
sy 是 已 知 还 是 未 知 。 


3.2.3 gy 已 知 时 p 值 的 计算 


当 oy 已 知 时 ,p 值 的 计算 方法 在 图 3 一 1 中 进行 了 总 结 。 如 果 样 本 容量 很 大 ,那么 ,在 
零 假 设 下 了 的 抽样 分 布 是 NN(pyo oy) ,这 里 ot =04/n。 因 此 ,在 零 假设 下 ,了 的 标准 化 形式 
(了 -Aro)very 服从 标准 正 态 分 布 。p 值 是 在 零 假设 下 得 到 比 ELAT ayoh) YRR 
概率 ,或 者 说 ,得 到 (Yjpyo)/os 的 绝对 值 大 于 (Y™ -pzyo)/as 的 绝对 值 的 概率 。 这 个 概率 
就 是 图 3 一 ! 中 所 显示 的 阴影 部 分 的 面积 。 用 数学 公式 表示 ,图 3 一 1 中 尾部 阴影 部 分 的 概 
率 ( 即 p 值 ) 为 : 
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ET, O 是 标准 正 态 累积 分 布 函 数 。 也 就 是 说 ,p 值 是 标准 正 态 分 布 在 + (YY -uroo 之 
外 的 尾部 区 域 的 面积 。 

公式 (3.6) 中 的 p 值 表达 式 依赖 于 总 体 分布 的 方差 my*。 在 实践 中 ,这 个 方差 通常 是 未 
知 的 {一 个 例外 是 , 当 Y, 是 二 元 变量 时 , 它 服 从 贝 努 里 分 布 ,这 种 情况 下 方差 是 由 零 假 设 决 
定 的 , 见 公式 (2.7) ) 。 由 于 一 般 在 计算 P 值 之 前 总 是 必须 先 估计 出 er, 困 此 ,我 们 现在 转向 
研究 oy 的 估计 问题 。 


3.2.4 样本 方差 样本 标准 差 与 标准 误 
样本 方差 苇 是 总 体 方差 邮 的 一 个 佑 计量; 样本 标准 差 sy 是 总 体 标准 差 5) 的 一 个 估计 





(3.6) 





















P 位 是 图 中 的 阴影 部 分 








注 :p 值 是 抽 到 的 了 值 至 少 和 殊 ' 一 样 不 同 于 上 。 的 概率 。 在 大 样本 中 ,了 在 零 假设 下 服从 分 布 
(aya, Gy) PELA, (Y - uyo )eoy RAST NO, D. Eie p 值 是 标准 正 态 分 布 在 + | (Y“ -由 )Zoy | 
之 外 的 尾部 阴影 部 分 的 概率 ， 

图 3 一 1 p 值 的 计算 
址 ;样本 均值 了 的 标准 误 是 了 的 抽样 分 布 标准 差 的 一 个 估计 量 。 
样本 方差 和 杯 准 差 。 样 本 方差 {sample variance)s 的 计算 公式 为 : 
seh Y (y. Py: (3.7) 
FERRE Æ {sample standard deviation) s, 是 样本 方差 的 平方 根 。 

样本 方差 的 表达 式 与 总 体 方差 的 表达 式 非常 相似 。 总 体 方 差 E(Y -jy)* 是 总 体 分 布 
中 (了 -Ar) 的 平均 值 。 同 样 ,样本 方差 是 (了 -uv)*(i=1,…,n) 的 样本 平均 值 ,但 有 两 个 
修正 ;一 个 是 用 了 代替 了 jy, 另 一 个 是 用 除数 -1 087 n. 

第 一 个 修正 也 即 用 了 代替 jy, 是 因为 jy 是 未 知 的 ,所 以 必须 估计 ,自然 地 ,uy 的 估计 量 
就 是 了。 第 二 个 修正 也 即 用 除数 ~1 代替 ,是 由 于 用 了 秸 计 gy WEY - Y)2 中 引入 了 
一 个 很 小 的 向 下 偏差 。 具 体 地 讲 , 正 如 在 练习 3. 11 中 所 证 明 的 ,EL(Y -YY ] =[(n-1)/ 
n]o+ N, E > (Y -Y)'=nE[(Y,-Y)'] =(n-l)ey,. 在 公式 {3.7) 中 用 4 - 1 fü n 
作 队 数 修正 了 这 个 小 的 向 下 偏差 ,因此 si 是 无 偏 的 。 

在 公式 {3.7) 中 ,由 n - 1 作 除 数 而 不 用 5 作 除 数 , 这 被 称 为 自由 度 (degrees of 
freedom) 的 修正 。 佑 计 均 值 用 去 了 部 分 信息 , 即 用 去 了 1 个 “自由 度 ” ,所 以 上 只 莘 下 n-i 个 
自由 度 。 

样本 方差 的 -- 致 性 。 样本 方差 是 总 体 方差 的 一 致 性 估计 重 , 即 : 

set (3.8) 
换 名 话说 , 当 很 大 时 ,样本 方差 以 很 高 的 概率 通 近 于 总 体 方差 。 

在 Y... Y. 为 独立 同 分 布 以 及 了 具有 有 限 的 四 阶 矩 , 即 ECI) < em 的 假设 下 ,附录 
3.3 证 明了 表达 式 (3.8) 中 的 结论 。 直 观 地 分 析 ,*y 是 一 致 性 的 原因 在 于 它 是 样本 的 均值 ， 
Br S 服从 大 数 定律 。 但 由 于 总 服从 大 数 定律 ( 见 重要 概念 2. 6) ,因此 ,( 了 - n, ) 必须 其 
有 有 限 方差 , 反 过 来 ,这 就 意味 着 号 (了 ; ) 一 定 是 有 限 的 ,也 就 是 说 ,了 一 定 具 有 有 限 的 四 
阶 短 。 
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样本 均值 的 概率 是 3. 9% , 

汪 了 服 以 自在 分 布 可 :统计 旺 的 分 布 ” 当 总 体 服从 正 态 分 布 时 ,i 统计 量 服从 自由 度 为 
n -1 的 学 生 : 分 布 ( 见 2.4 节 ) ,因此 在 这 个 特殊 情况 下 ,对 于 任意 的 样本 容量 ", 不 依赖 中 
心 极限 定理 就 能 精确 地 计算 p 值 。 由 于 学 生 + 分 布 尾部 的 面积 要 大 于 正 态 分 布 的 尾部 面 
积 , 因 此 ,利用 学 生 ;分布 计算 的 p 值 要 比 用 正 态 分 布 计算 的 p 值 略 大 一 些 。 

虽然 一 些 统计 软件 和 用 学 生 ! 分 布 来 计算 p 值 ,但 是 本 书 不 使 用 这 个 分 布 计算 5 值 , 原 
因 有 两 个 。 第 一 ,: 统计 量 只 有 在 总 体 服 从 正 态 分 布 的 条 件 下 才 服 从 学 生 分布 ,而 学 生 ! 
分 布 常 常 与 经 济 数据 的 实际 分 布 较 差 地 近似 。 因 此 , 当 了 服从 正 态 分 布 时 ,这 个 分 布 精确 
成 立 的 优势 被 它 不 太 适用 的 事实 给 否定 了 。 第 二 ,如 果 样 本 容量 适度 ,学 生 分布 和 正 态 分 
布 的 差别 非常 小 ,而 如 果 样 本 容量 很 大 ,这 个 差别 可 以 忽略 。 对 于 n>15, 用 1 分 布 和 正 态 分 
布 所 计算 的 已 值 的 差 不 会 超过 0. 01 ,而 对 于 mn > 80 ,它们 的 差 绝 不 会 超过 0. 002。 在 现代 应 
用 中 ,以 及 在 本 书 所 有 的 应 用 中 ,样本 容量 都 是 数 以 百 干 计 的 ,因此 ,样本 容量 大 得 足以 忽略 
学 生 : 分 布 和 正 态 分 布 之 间 的 差异 。 


3.2.7 事先 设 定 显著 性 水 平 条 件 下 的 假设 检验 


假设 已 经 决定 ,如 果 p 值 小 于 5% ,那么 就 拭 绝 零 假 设 。 由 于 在 正 态 分 布 的 尾部 超过 

1. 96 部 分 的 面积 是 5% ,因此 这 给 出 了 一 条 简单 的 规则 ; 
如 时 | |1 >1.6, 那 么 就 拒绝 衬 假 设 画 (3.15) 

也 就 是 说 ,如 果 由 样本 所 计算 的 上 统计 量 的 绝对 值 大 于 1.96 ,那么 就 拒绝 零 假 设 。 如 果 n 足 
够 大 ,那么 在 零 假设 下 :统计 量 服 从 NN(0,1) 分 布 。 因 此 ,错误 地 指 绝 零 假 设 { 当 零 假设 实际 
为 真 时 却 拒 绝 了 零 假设 ) 的 慨 率 是 5%。 

这 个 检验 统计 假设 的 概念 框架 包含 一 些 专业 术语 ,这 些 术 语 在 重要 概念 3.5 中 做 了 总 
结 。 在 表达 式 (3. 15 ) 中 检验 的 显著 性 水 平 是 5 多 ,这 个 双边 检验 的 临界 值 是 1. % ,拒绝 域 是 
t 统计 量 在 +1.96 以 外 的 值 。 如 果 检 验 在 5 名 的 显著 人 性 水 平 下 拒绝 零 假设 ,那么 就 可 以 说 ， 
在 5 名 的 显著 性 水 平 下 总 体 均 值 在 统计 上 显著 地 不 同 于 jy0。 


重要 概念 3.5 








假设 检验 的 术语 

在 零 假 设 下 ,一 个 统计 假设 检验 事先 设 定 的 拒绝 概率 就 是 该 检验 的 显著 性 水 有 本 
( significance level) 。 检 验 统计 重 的 临界 值 { critical value) ,是 指 在 给 定 的 显著 性 水 平 下 检 
验 栓 好 拒绝 了 零 假 设 的 那个 统计 量 的 值 。 检 验 拒绝 零 假 设 时 该 检验 统计 量 的 值 的 集合 称 为 
拒绝 域 (rejection region ) ,不 能 拒绝 零 假设 的 检验 统计 量 的 值 的 集合 称 为 接受 域 
(acceptance region) 。 当 零 假 设 为 真 时 ,检验 结果 实际 上 上 却 不 正确 地 拒绝 了 零 假设 的 概 
率 ,这 称 为 检验 的 级 效 (size ,又 称 检验 的 级 。 译 者 注 ) ; 当 备 择 假 设 为 真 时 ,检验 结果 正确 地 
拒绝 了 零 假 设 的 概率 ,这 称 为 检验 的 功效 (power, 又 称 检验 的 势 , 译 者 注 } 。 

p 值 是 在 假定 零 假设 为 真 的 情况 下 ,由 随机 抽样 变 化 得 到 的 检验 统计 重 至 少 与 实际 观 
测 到 的 统计 量 一 样 背离 零 假设 的 概率 。 同 理 ,p 值 是 拒绝 零 假 设 的 最 小 显著 性 水 平 。 

利用 事先 设 定 的 显著 性 水 平 检验 假设 ,并 不 需要 计算 上 值 。 在 前 面 的 检验 假设 即 检验 
“ 刚 毕 业 大 学 生 的 平均 收 人 为 20 美元 /小 时 "的 例子 中 ,i 统计 量 为 2.06, 它 超过 了 1.%6, 所 
以 零 假设 在 5 久 的 显著 性 水 平 下 遭 到 了 皂 绝 。 虽 然 以 5 免 的 显著 性 水 乎 比较 容易 进行 假设 


检验 ,但 是 仅仅 报告 在 事先 给 定 的 显著 性 水 平 下 是 否 拒绝 零 假设 所 传达 的 信息 比 报告 p 什 
所 传达 的 信息 要 少 。 

实践 中 应 采 用 多 大 的 显 入 陡 水平 在 很 多 情况 下 ,统计 学 家 和 经 济 计量 学 家 使 用 5% 
的 显著 性 水 平 。 如 果 你 要 在 5% 的 显著 性 水 平 下 检验 多 个 统计 假设 ,那么 平均 每 20 个 检验 
中 ,你 就 会 错误 地 拒绝 一 个 零 假设 。 有 时 设 定 更 加 保守 的 显著 性 水 平 可 能 是 笑 宜 的 。 例 如 ， 
法 律 案件 有 时 涉及 统计 证 据 , 零 假设 可 能 是 被 告 人 无 罪 ,那么 ,人 们 可 能 会 非常 希望 得 到 确 
定性 的 结论 ,比如 拒绝 零 假设 (有 罪 的 结论 ) 并 不 是 随机 样本 变化 的 结果 。 因 此 在 一 些 法 律 
案件 中 ,经 常用 1% 甚 至 0. 1% 来 设 定 显著 性 水 平 以 避免 此 类 错误 的 发 生 。 同 样 ,如 果 政 府 
机 构 焉 考虑 批准 一 种 新 药 的 销售 ,非常 保守 的 标准 可 能 是 合适 的 ,这 样 可 以 保证 消费 者 在 市 
场 上 买 到 的 药品 确实 有 效 。 

使 用 非常 低 的 显著 性 水 平 ,也 就 是 变 得 非常 保守 ,这 是 需要 付出 代价 的 ; 当 零 假设 为 候 
时 ,显著 性 水 平 越 小 .临界 值 越 大 ,拒绝 零 假设 就 越 困 难 。 实 际 上 ,最 保守 的 做 法 就 是 永远 不 
拒绝 零 假设 ,但 如 果 你 真 的 那样 做 的 话 , 你 永远 也 不 需要 调查 任何 的 统计 证 据 ,因为 你 绝 不 
会 改变 你 的 看 法 ! 显著 性 水 平 越 低 , 检 验 的 功效 就 越 低 。 许 多 经 济 和 政策 方面 的 应 用 要 求 
的 保守 程度 比 法 律 案件 要 宽松 一 些 ,因此 通常 认为 5 名 的 显著 性 水 平 是 个 合理 的 折 中 的 
方案 。 

关于 总 体 均值 双边 备 择 假设 的 假设 检验 的 程序 ,在 重要 概念 3. 6 中 做 了 总 结 。 


重要 概念 3.6 


检验 假设 (7) =Aro 与 对 应 的 备 择 假 设 E(Y) H jiya 
1. 计算 了 的 标准 误 SE( Y) (公式 (3. 14))。 
2, 计算 ;统计 量 (公式 (3. 10) ) 。 
3. 计算 p 值 (公式 {3.13))。 如 果 p 和 值 小 于 0.05{ 同 理 , 如 果 上 1 >1.96) ,那么 在 5 名 
的 显著 性 水 平 下 拒绝 零 候 设 。 


3.2.8 单 边 备 择 假设 检验 


在 某 些 情况 下 , 备 择 假 设 可 能 是 均值 大 于 Aros 例如 ,人 们 需 望 教育 在 劳动 力 市 场 上 有 
积极 作用 ,因此 ,相对 于 大 学 毕业 生 和 非 大 学 毕业 生 收 和 人 相同 的 零 很 设 面 言 , 备 树 假 设 不 再 
是 他 们 的 收入 有 差别 ,而 是 大 学 毕业 生 要 比 非 大 学 毕业 生 的 收 人 高 。 这 种 备 择 假 设 锌 称 为 
单 边 备 择 假设 [one-sided alternative hypothesis) ,可 写 为 ; 

H ECY) >pyo CHARRIE) (3.16) 

对 单 边 备 择 假 设 而 言 ,计算 5 值 和 假设 检验 的 一 般 方法 与 双边 备 择 假设 的 方法 相同 ,只 
是 有 一 点 履 改 , 即 ! 统计 其 只 有 大 的 正 的 值 才 会 拒绝 零 假 设 , 而 不 是 大 的 绝对 值 。 具 体 来 
讲 , 为 了 检验 不 等 式 (3. 16) 中 的 单 边 假设 ,需要 构造 公式 (3. 10) 中 的 1 统计 量 。p 值 是 在 标 
准 正 态 分 布下 所 计算 的 + 统计 量 右 侧 的 面积 。 也 就 是 说 ,基于 # 统计 量 分 布 的 标准 正 态 分 布 
N(0,1) 近 似 原 理 ,p 值 为 : 

p {È = Pry (Z>™) 51-00") (3.17) 

在 5%% 的 显著 性 水 平 下 单 边 检 验 和 (0,1) 分 布 的 临界 值 是 1. 645。 该 检验 的 拒绝 域 就 是 所 有 
大 于 1.645 的 1 统计 量 的 值 。 

不 等 式 (3, 16) 中 的 单 边 假设 关注 Ar 大 于 pyo 的 值 。 如 果 反 过 来 , 备 择 假设 是 ELY) < 
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niii 总 体 均 值 置信 区 间 的 覆盖 概率 (coverage probabiity ) ,是 措 通过 重复 抽样 
计算 的 该 区 间 包 含 真实 总 体 均值 的 概率 。 


重要 概念 3.7 
总 体 均 值 的 年 信 区 间 
i 的 5 名 的 双边 置信 区 间 是 这 样 移 造 的 一 个 区 间 , 在 各 种 应 用 中 有 95% MAA Cr 
包含 有 jy 的 真实 值 。 当 样本 容量 n 很 大 时 ,wy BJ 95% ,90% F 999% H 8 Ë KEE: 
pr 的 95 久 的 置信 区 间 = | Y + 1. 965E( Y) | 
Ar 的 名 揭 置信 区 间 = {F + 1.648EF(Y)1 
Ar 的 99% 的 置信 区 间 = |Y +2. 57SE(Y) | 





34 不 同 总 体 均值 的 比较 - 


平均 来 说 , 刚 毕 业 的 男女 大 学 生前 收入 相同 吗 ? 这 个 问题 涉及 比较 两 个 不 同 总 体 分 布 
的 均值 。 本 节 归 纳 了 如 何 检 验 两 个 不 同 总 体 均值 差 的 假设 以 及 如 何 构造 其 置信 区 间 的 
问题 。 


3.4. 1 两 个 均值 的 差 的 假设 检验 


i u, 为 刚 毕 业 移 交大 学 生 总 体 平均 每 小 时 收入, 并 设 jp。 为 刚 毕 业 的 男 大 学 生 总 体 平 
均 每 小 时 收入 ,考虑 零 假设 :这 两 个 总 体 的 收入 差 为 一 个 确定 的 数 ,比如 说 d ,那么 等 假设 
和 双边 备 择 假 设 为 ， 





Hy iln he =d, H, ipn Zu d, (3.18) 

在 这 两 个 总 体 中 ,男女 具有 相同 收 人 "这 一 零 假 设 ,与 表达 式 (3. 18) 中 当中 =0 时 的 
R H, 是 对 应 的 。 

由 于 这 些 总 体 的 均值 是 未 知 的 ,因此 必须 使 用 男女 的 样本 数据 进行 估计 。 假 设 我 们 拥 
有 从 总 体 中 随机 抽取 的 n, 名 男 大 学 生 样本 入, 名 女 大 学 生 样本 。 设 男 、 妇 大学生 样本 摇 
平均 年 收入 分 别 为 A Y. EZ =, -上 的 估计 量 就 是 又 -Fro 

利用 也 -F, RRE pn -ue = d, RIRE Y. - Y, 的 分 布 。 根 据 中 心 极限 定 
理 , 我 们 知道 7, 近似 地 服从 分 布 NO sazyna) ,其 中 只 是 男生 收入 的 总 体 方差 。 同 理 ,Y 
近似 服从 分 布 NC ,027n,) ,其 中 2 是 女生 收入 的 总 体 方差 。 另 外 ,由 2. 4 节 可 知 ,两 个 
正 态 随机 变量 的 加 权 平 均 本 身 也 服从 正 态 分 布 。 因 为 3, 和 了 是 由 两 个 不 同 的 随机 选择 的 
样本 构造 出 来 的 ,所 以 它们 是 独立 随机 变量 。 因 此 ,了 , Q Y. BAST N a -js Onn) 
+ (gs/n,)]o 

如 果 oz 和 oa? 是 已 知 的 , 奢 么 这 个 近似 正 态 分 布 可 被 用 来 计算 检验 稚 假 设 志 ,~ = d, 
的 p 值 。 然 而 ,实际 上 这 些 总 体 方差 通常 是 未 知 的 ,因此 必须 对 它们 进行 估计 。 如 前 所 述 ， 
可 以 用 样本 方差 点 和 时 来 估计 它们 ,这 里 号 的 定义 在 公式 (3.7) 中 已 经 给 出 了 ,不同 的 是 
这 个 统计 量 是 只 对 样本 中 的 男生 进行 计算 得 出 的 ,女生 只 的 定义 方式 与 之 相同 。 因 此 ,了 
- Y, 的 标准 误 为 ; 








(3.19) 


攀 造 检验 零 假设 的 1 统计 量 与 检验 单个 总 体 均 值 假设 的 ! 统 计量 类 似 , 即 通 过 将 估计 量 
Y. -YV. RE pn -jp 的 零 假设 值 , 再 除 以 了 - Y. 的 标准 误 , 即 : 


_ (y, - Y) -由 , 
“SECY, -Y.) (ERRAN E) (3. 20) 


如 果 m FB n, 都 很 大 ,那么 这 个 + 统 计量 服从 标准 正 态 分 布 ,2 

因为 当 n 和 ni 很 大 时 ,公式 (3.20) 中 的 t 统 计量 在 零 假 设 下 服从 标准 正 态 分 布 ,所 
以 ,双边 检验 p 值 的 计算 方法 与 单个 总 体 中 总 值 的 计算 方法 完全 相同 , 即 p 值 可 以 用 公式 
(3.13) 来 计算 。 

要 进行 一 个 事先 设 定 显著 性 水 平 的 检验 ,只 需 计算 出 公式 (3. 20) 中 的 :统计 量 , 并 将 它 
和 相应 的 临界 值 做 比较 。 例 如 ,如 果 : 统 计量 的 绝对 值 超 过 了 1. % ,那么 可 在 $ 名 的 显著 性 
水 平 下 拒绝 零 假设 。 

如 果 备 择 假 次 是 单 边 的 而 不 是 双边 的 , 即 如 果 备 择 假设 是 凡 。 - =, > 而 ,那么 ,检验 应 该 
按照 3.2 节 中 所 总 结 的 那样 进行 调整 。 利 用 公式 (3.17) 计 算 p 值 , 当 1>1.65 时 ,检验 在 
5 多 的 显著 性 水 平 下 拒绝 零 假 设 。 


3.4.2 两 个 总 体 均 值 差 的 置信 区 间 

在 3.3 节 中 所 总 结 的 构造 置信 区 间 的 方法 可 推广 到 构造 均值 之 差 d =n, -jn 的 置信 区 
间 。 国 为 如 果 |t| > 1 站 ,那么 在 5 蚤 的 显著 性 水 平 于 拒绝 盘 设 值 和 ,所 以 如 果 1 么 1.9%6 , 那 
么 山 将 会 在 置信 集中。 但 是 ,iil <1.96 意味 着 估计 偏差 下 , - Y. 距离 d, 不 超过 1.96 个 标 
淮 误 。 因 此 ,的 5 免 的 双边 置信 区 间 由 了 - Y, 在 +1. 6 个 标准 误 的 范围 内 的 那些 4d 值 
给 成 ; 





d=p, -二 的 95% 的 置信 区 间 =(Y, - Y.) *1.98SE(Y, — Y.) (3.21) 
熟悉 了 这 些 公式 ,我 们 现在 开始 对 美国 大 学 毕业 生 不 同性 别 的 收 人 差异 进行 实证 研究 。 


3.5 美国 男女 大 学 毕业 生 的 收入 总 题 - 


历史 上 男性 比 女 性 更 易于 找到 好 报酬 的 工作 。 但 是 ,社会 规范 的 变化 和 禁止 性 别 歧 视 
法 律 的 实施 已 使 男女 在 现代 工作 场所 中 具有 平等 的 角 但 如 果 
存在 性 别 收 入 差异 的 话 ,受到 良好 教育 的 青年 男女 之 间 的 收入 差异 实际 上 是 多 少 呢 ? 

表 3 一 1 给 出 了 美国 年 龄 在 25 ~34 岁 之 间 的 大 学 毕业 的 全 职 劳动 者 每 小 时 收入 的 估计 
值 。 表 3 一 1 中 的 统计 数据 是 根据 当前 人 口 普查 (CPS) 的 部 分 数据 计算 得 到 的 ,附录 3.1 中 
描述 了 CPS。 利 用 消费 价格 指数 多 将 所 有 的 收入 调整 为 1998 年 的 美元 价值 水 平 ,也 即 对 通 





名 ”各 果 两 个 总 体 的 方差 相等 ( 即 ol - o, =o) ,那么 ~ MRA N m pwll Rn) +n Jo?) ER 
种 特殊 情况 下 ,可 以 使 用 所 谓 的 =° AJEA EHR eolo variance estimator) ; 
ma" l$ o- -Y.)2 + $o- -Y,)2] 


求 和 项 是 对 男生 现 洞 信 而 言 的 ,而 第 二 个 求 和 项 是 对 女生 戏 测 值 而 宫 的 。 如 时 总 体 方差 不 同 , 屠 
是 有 偏 的 ， 而 且 是 不 一 致 的 。 “因此 ,除非 有 有 很 好 的 理由 相信 息 体 方差 RRI, 否则 在 实际 中 不 应 该 
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货 脱 胀 进行 了 调整 。 
按 1998 年 美元 计算 的 年 龄 在 25 ~34 内 之 间 美 国 大 学 毕业 职工 的 每 小 时 收入 

















表 3 1 (来 自 于 当前 人 口 普查 的 部 分 统计 数据 ) 
w E: ELS 
Y n n Y s a CYCY, O T) SAREEK 
1992 17.57 7.50 1591 15,22 5,97 1371 235** 0.25 1. 87 —- 2.84 
1994 16.93 7,39 1598 15.01 6.41 1 358 1 927" 0.25 1. 42 -2.42 
1996 16.88 729 1374 14.42 607 1235 24611 0. 26 1. 94 -~ 2. 97 
1998 17.94 7.86 1393 15.49 6.80 1210 24571 0. 29 1.89 -3.02 


注 ; 这 些 估 计 值 是 利用 所 示 年 份 CPS 的 年 龄 在 25 - 34 2 ARARLAR EH PEB. ZE 5% 
或 “i 久 的 显著 性 水 平 下 ,这 个 差 显 着 地 异 于 零 。 

表 3 一 1 的 前 三 列 给 出 了 男性 收入 的 描述 性 信息 ; 接 下 来 的 三 询 给 出 了 女性 收入 的 描 
述 性 信息 ;最 后 三 列 给 出 了 男女 收入 之 差 的 信息 ,例如 , 1999 年 3 月 实施 的 当前 人 口 
普查 (CPS) 共 调查 了 64 000 个 家 庭 ,其 中 包括 1 393 个 年 龄 在 25 - 34 岁 之 间 拥 有 大 学 学 
位 的 全 职 男 职工 。 这 1 393 个 男性 在 1998 年 平均 每 小 时 的 收入 是 17. 94 美元 ,这 些 收 入 
的 标准 差 是 7. 86 美元 。 在 那 次 调查 中 ,1 210 个 女性 的 平均 每 小 时 收入 是 15.49 美元 , 标 
HEX E 6.80 美元 。 工 资 差 为 17.94 - 15.49 = 2. 特 (美元 /小 时 ), 标 淮 误 是 
v (7. 86°/1 393) + (6. 80°71 210) =0,29( 美 元 )。 所 以 ,检验 工资 差额 为 0 的 上 统计 量 是 
(2.45 -0)“0.29 =8, 御 , 它 超过 了 1 免 显 着 性 水 平 下 的 双边 检验 临界 值 2.58, 所 以 它 在 1% 
的 水 平 下 (实际 上 , 它 在 0.01% 的 水 平 下 也 蚌 显 著 的 ) 蚌 显著 的 。 这 个 收入 差 的 95% 的 置 
信 区 向 是 2. 45 +1.96 x0.29 美元 = (1.89 美元 ,3. 人 2 美元 )。 也 就 是 说 ,在 5 免 的 置信 水 
平 下 ,我 们 估计 这 两 个 总 体 之 间 的 工资 差 在 1. 89 美元 和 3. 02 美元 之 间 。 

男女 工资 的 差额 比较 大 。 根 据 表 3 一 1 中 的 估计 值 ,在 1998 年 ,女性 的 每 小 时 收 人 比 男 
性 少 14% (2.45717.94) 。 此 外 ,这 个 兰 额 在 20 Ha 90 年 代 没 有 发 生 多 大 的 变化 ,这 个 情 
计 差 额 不 太 可 能 仅仅 是 由 人 为 的 抽样 误差 造成 ,因为 1. 89 美元 仅仅 是 包含 在 1998 年 95% 
的 置信 区 间 里 收 人 差额 的 最 小 值 。 

这 个 统计 分 析 表 明了 在 每 小 时 平均 收 人 上 存在 “性 别 差 异 ” ,但 它 并 没有 说 明 这 个 差异 
的 来 源 或 原因 。 这 个 差异 是 劳动 力 市 场 中 性 别 野 视 的 结果 ,还 是 在 工作 技能 和 经 验方 面 男 
狂 和 女性 之 间 有 差别 进而 导致 收 人 的 不 局? 要 解决 这 些 问题 ,我 们 需要 借助 于 多 元 回归 分 
析 ,这 也 是 本 书 第 2 部 分 的 主题 。 不 过 ,首先 我 们 必须 复习 散 点 图 、 样 本 协 方差 和 样本 相关 
系数 。 








G3.6_ 散 点 图 、 样 本 协 方 差 和 样本 相关 系数 : 


年 龄 和 收入 之 间 有 什么 关系 ? 像 许 多 其 他 问题 一 样 ,这 个 问题 将 一 个 变 最 A 
另 一 个 变量 交 收 入 ) 联 系 在 一 起 。 本 节 回 顾 总 结 了 反映 变量 之 间 关 系 的 三 种 方法 ; 散 点 图 、 
样本 协 方差 和 样本 相关 系数 。 


3.6.1 散 点 图 
散 点 图 (scatter plot) 是 关于 X, 和 Y, 的 = 个 观测 值 的 图 形 ,其 中 每 个 观测 值 是 用 点 











(X Y ) 来 表示 的 。 例 如 ,图 3 一 2 是 来 自 1999 年 3 月 CPS 的 在 通讯 业 中 工作 但 没有 大 学 学 
历 的 184 名 技工 样本 的 年 龄 (X) 和 每 小 时 收入 (了 ) 的 散 点 图 。 图 3 一 2 中 的 每 一 点 都 对 应 于 
一 对 观测 值 (,Y) ,例如 ,这 个 样本 中 有 一 个 35 岁 的 技工 ,每 小 时 收入 为 19.61 美元 ,这 个 
技工 的 年 龄 和 收入 由 图 3- -2 中 较 大 的 彩色 点 表示 。 散 点 图 显示 了 这 个 样本 中 年 龄 和 收入 
之 问 的 正 相 闫 关系: 年龄 较 大 的 通讯 技工 趋向 于 比 年 龄 较 小 的 技工 挣 得 更 多 ,但 是 ,这 个 关 
系 是 不 精确 的 , 仪 任 -个 人 的 年 龄 还 不 能 够 完全 地 预测 他 的 收入 。 

得 小 时 下 岁 收 入 
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注 : 图 中 的 每 一 个 点 代表 了 184 名 工人 样本 中 每 一 名 工人 的 年 秀和 平均 收入 。 图 中 较 大 的 彩色 点 
对 应 于 平均 收入 为 19.61 美元 的 一 名 35 岁 工 人 。 数 据 来 自 于 1999 年 3 月 CPS 中 没有 大 学 学 历 的 通讯 
EHTI, 
3—2 ”平均 每 小 时 收入 与 年 龄 的 散 点 图 


3. 6.2 样本 协 方差 和 样本 相关 性 


内 方差 和 相关 性 ( 由 关系 数 ) 作为 随机 变量 X 和 了 的 联合 概率 分 布 的 两 个 性 质 ,我 们 在 
2.3 节 中 已 经 介绍 过 了 。 因 为 总 体 分 布 是 未 知 的 ,所 以 实际 上 我 们 不 知道 总 体 的 协 方差 或 
相关 系数 。 不 过 ,通过 抽取 总 体 中 n 个 个 体 的 随机 样本 并 收集 数据 ( 针 ,Y) i= l, n R 
们 便 能 够 估计 出 总 体 的 协 方差 和 相关 系数 。 

样本 协 方差 和 相关 系数 是 总 体 协 方差 和 相关 系数 的 估计 量 。 和 本 章 前 面 讨论 的 佑 计量 
-- 样 ,它们 起 通过 用 样本 均值 代替 总 体 均值 (期 望 ) 来 计算 的 ， 样 本 协 方差 {sampfe 
covariance) ,用 sw 表示 ,其 计算 公式 为 ， 


s= È -DO -P) (3.22) 


和 样本 方差 一 样 ,公式 (3. 22) PAPARRA n1, MPERA n RA pe 


生 这 个 差异 的 原因 是 因为 使 用 了 宗 和 了 来 估计 它们 各 自 的 总 体 均值 。 当 ”很 大 时 ,除数 是 
n 还 是 n -1 的 差别 并 不 大 。 

IERIE A sample correlation coefficient) ,或 称 样本 析 关 性 {sample correlation) 

是 样本 协 方差 与 样本 标 淮 差 之 比 ,用 rw 表示 ,其 计算 公式 为 ; 

ry = (3.23) 
样本 相关 系数 测度 个 观测 值 的 样本 中 下 和 了 之 间 线 性 相关 的 强度 。 和 总 体 相 关系 数 一 
样 ,样本 相关 系数 也 是 没有 单位 的 ,其 值 介 于 ~] 和 1 之 间 , 即 | ro | si, 

对 于 所 有 的 i ,当头 = 了 时 样本 相关 系数 等 于 1; 对 于 所 有 的 1, 当 X= -了 时 样本 相关 
系数 等 于 - 1。 重 一 般 地 说 ,如 果 茹 点 图 是 一 条 直线 ,那么 相关 系数 为 1。 如 果 该 直线 向 上 
倾斜 , 则 在 工 和 了 了 之 间 存 在 正 的 相关 性 及 相关 系数 为 1; 如 果 该 直线 向 下 倾斜 , 则 开 和 了 之 
间 存 在 负 的 由 关 性 且 相关 系数 为 -1。 散 点 图 越 接近 于 直线 ,相关 系数 越 接 近 于 + 上 1。 高 的 
相关 系数 并 不 意味 着 直线 的 斜率 很 陡峭 ,而 是 说 明 散 点 图 中 的 点 非常 趋 近 于 一 条 直线 。 


3.6.3 样本 协 方差 和 样本 相关 系数 的 一 致 性 
和 样本 方差 一 样 , 样 本 协 方差 也 是 一 致 的 , 即 : 


5 (3.24) 
换 句 话说 ,在 大 样本 中 ,样本 协 方差 以 很 高 的 概率 通 近 于 总 体 协 方差 。 
在 (X,,Y,) 是 独立 同 分 布 的 日 X, 和 了 具有 有 限 的 四 阶 矩 的 假设 下 ,表达 式 (3, 24) 的 证 
明 类 似 于 附录 3. 3 中 样本 协 方差 一 致 性 的 证 明 ,这 个 证 明 留 作 练习 ( ak 15.25. 


由 于 样本 方差 和 样本 协 方差 都 是 一 致 的 ,因此 样本 相关 系数 也 是 一 致 的 , 即 rp 一 一 
corr(X.,Y ), 

MI 帮 为 一 个 例子 ,考虑 图 3 一 2 中 关于 年 龄 和 平均 收入 的 数据 。 这 184 各 工人 的 年 
龄 的 样本 标准 差 为 s, =10.49 年 ,收入 的 样本 标准 差 为 s; = 6.44 美元 /小 时 ,年 瞬 和 收 人 之 
间 的 协 方差 为 we =24. 29( 单 位 是 年 x 美元 /小 时 ,不 容易 解释 )。 因 此 ,相关 系数 为 mr = 
24.29/(10.49 x6. 44) =0. 36, RERA 36%, 0. 36 的 相关 系数 意味 着 在 年 龄 和 收入 之 阅 
存在 正 向 关系 ,但 如 散 点 图 所 揭 镍 的 ,这 个 关系 远 不 够 完善 。 

为 了 证 明 相 关系 数 不 依 赖 于 测度 单位 ,假定 收入 用 美 分 作 单 位 ,在 这 种 情况 下 ,收入 的 
样本 标准 差 为 644 美 分 /小 时 ,年龄 和 收入 之 间 的 协 方差 为 2 429{( 单 位 是 年 x 美 分 “小 时 ) ， 
那么 相关 系数 为 2 429/( 10.49 x644) =0. 36, 或 表示 为 36% , 

图 3 一 3 给 出 了 另外 一 些 散 点 图 和 相关 性 的 例子 。 图 3 一 3(a) 显示 了 这 些 变量 之 间 很 
猩 和 的 正 线性 关系 ,样本 相关 系数 为 0.9。 图 3 一 3(b) 显 示 了 样本 相关 系数 为 -0.8 的 较 强 的 
负 线性 关系 。 图 3--3(c) 显 示 了 没有 明显 关系 的 散 点 图 ,样本 相关 系数 为 0。 图 3 一 3(d) 显 
示 了 两 个 具有 明显 关系 的 变量 : 随 着 三 的 增加 ,了 先 增 大 后 减 小 。 虽 然 二 和 了 之 间 存 在 可 识 
别 的 关系 ,但 是 它们 的 梯 本 相关 系数 却 为 0, 原因 就 是 对 这 些 数 据 而 言 ,小 的 了 值 同 大 的 和 
小 的 X 值 者 有关。 

最 后 的 这 个 例子 强调 了 重要 的 一 点 :相关 系数 是 线性 关系 的 一 种 测度 。 因 3 一 3(d) 中 
六 和 了 之 间 虽 然 存 在 关系 ,但 不 基线 性 的 。 
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注 : 图 3 一 3(a) 和 图 3 一 3(b) 中 的 散 点 图 明示 了 与 Y 之 间 很 强 的 线性 关系 ,在 图 3 一 3(e) 中 ,XX 独 
立 于 了 ,因此 这 两 个 变量 不 相关 。 在 图 3 一 3(d) 中 ,即使 这 两 个 变量 之 间 存 在 非 线性 关系 ,它们 仍然 是 不 
相关 的 。 

图 3 一 3 ”四 个 恨 设 数据 集 的 散 点 图 


[总 结 


1. 样本 均值 了 是 总 体 均值 xy 的 一 个 估计 量 。 当 了 ,… ,了 独立 同 分 布 时 : 

a. 了 的 抽样 分 布 的 均值 为 jy ,方差 为 y = ayn; 

b. 了 是 无 偏 的 ; 

c. 根据 大 数 定律 ,了 是 一 致 的 ; 

d. 根据 中 心 极限 定理 , 当 样 本 容量 很 大 时 ,了 具有 近似 的 正 态 抽样 分 布 。 

2.7 统计 量 用 来 检验 总 体 均 值 取 某 一 特定 值 的 零 假 设 。 如 有 果 很 大 , 当 零 假设 为 真 时 ,s 
统计 量具 有 标准 正 态 抽样 分 布 。 

3.2 统 计量 可 用 来 计算 与 零 假 设 有 关 的 p tÉ. DA p ERRERA RER. 

计 4.z 的 5% 的 置信 区 间 是 一 个 构造 区 间 , 因 此 ,在 5% 的 重复 抽样 中 , 它 包 含 jw 的 

真 值 。 





5. 两 个 总 体 均 信 差异 的 假设 检验 和 置信 区 间 在 概念 上 类 似 于 单个 总 体 均值 的 假设 检 
验 和 置信 区 间 。 


6. 样本 相关 系数 是 总 体 相关 系数 的 一 个 估计 鞭 , 它 测度 了 两 个 变量 之 癌 的 线性 关系 ， 
即 它 们 的 散 点 图 近似 于 直线 的 程度 如 何 。 





r 重 要 术语 - 


iE MHE MÆ .一致 性 和 有 效 性 ”最 小 二 乘 估 计量 假设 检验 ” 零 假设 和 备 
择 假设 “双边 备 拌 假设 pii 样本 方差 样本 标准 差 自由 度 + 统计 量 估计 基 的 标 
准 误 ”检验 统计 基 ”显著 性 水 平 临界 值 ”拒绝 域 检验 的 级 效 ”检验 的 功效 ” 单 边 备 择 
假设 ”置信 集 置信 水 平 ”置信 区 间 EAF ”两 个 均值 之 差 的 检验 ”接受 域 散 点 图 
样本 协 方差 和 样本 相关 系数 





-复习 概念 - 


3.1 请 解释 样本 均值 了 和 总 体 均值 之 间 的 差别 。 

3.2 请 解释 估计 量 和 估计 值 之 间 的 差别 ,并 分 别 举 一 个 例子 。 

3.3 包 知 总 体 分 布 的 均值 等 于 10, 方 差 等 于 16。 当 :(a}n=10,(b)n=100,(c)a= 
1 000 时 ,确定 从 这 个 总 体 中 抽取 的 -一 个 独立 同 分 布 样本 的 了 的 均值 和 方差 ,请 将 你 的 答案 
与 大 数 定律 联系 起 来 。 

3.4 中 心 极 殷 定理 在 统计 假设 检验 中 起 什么 作用 ? 在 构造 置信 区 间 中 又 起 什么 作用 ? 

3.5 去 息 设 和 备 择 假设 的 区 别 是 什么 ? RA .显著 性 水 平和 功效 的 区 别 是 什么 ? 单 边 
备 择 假 设 和 双边 备 择 假设 的 区 别 是 什么 ? 

3.6 为 什么 置信 区 间 包 含 的 信息 要 比 单个 的 假设 检验 多 ? 

3.7” 当 总 体 相关 系数 为 ;(a)1.0;(b) -1.0;(c)0.9;(d) -0.5;(e)0.0 时 , 画 出 样本 
容量 为 10 的 两 个 随机 变量 样本 的 散 点 图 。 


[练习 


3.1 在 一 个 jy=100,ct=43 的 总 体 中 ,运用 中 心 极限 定理 回答 下 列 癌 题 : 

"a. EMR n = 100 的 随机 样本 中 , 求 Pr(Y <101); 

b. 在 一 个 容量 n=64 的 随机 样本 中 , 求 Pr(101 < 了 <103); 

e. 在 一 个 容量 n=165 的 随机 样本 中 , 求 Pr( 了 >98) 。 

3.2 设 了 是 个 风 努 里 随机 变量 ,其 成 功 概率 Pr(Y=1) =p, 设 从 这 个 分 布 中 抽取 的 ， 
…, 了 ,是 独立 同 分 布 的 ,p 为 这 个 样本 的 成 功 概率 。 

8. 证 明 :p =Y: 

b. HEHH:p 是 p 的 无 偏 估计 其 ，; 

e WE; varp) =pl! —p)/Zn, 

3.3 在 对 400 名 可 能 成 为 选民 的 一 次 调查 中 ,有 215 人 表示 要 支持 在 任 者 ,而 185 人 
则 表示 要 支持 挑 感 者 。 设 代表 在 调查 时 希望 支持 在 任 者 的 所 有 可 能 选民 的 比例 ,用 P 表 
示 被 调查 对 象 中 支持 在 任 者 的 选民 比例 。 

"a 利用 调查 结果 估计 pp。 

‘b 利用 $ 的 方差 估计 基 PC1 -p)/n 计算 你 的 估计 量 的 标准 误 。 





ECY) hie Rihi. 
币 祝 分 过 明 方 法 .为 了 使 硕 测 误差 平方 和 最 小 化 ,我 们 对 它 求 导 , 并 令 其 导数 为 零 。 


d A , > n _ 此 
Dp LY, - m) = -2 È (Y, -m) = -2 Ð Y, + 2nm =0 (3.25) 


解 最 后 . -个 方程 中 的 m RARAN, 4 m = Y 8.2 fËE Y (Y, - m)? 最 小 化 。 
非 徽 积分 这 昌 记 法 ， RIDER REBR RINER 了 之 差 必 为 0, 由 此 得 出 Y 
是 最 小 二 乘 估 计量 , 设 d=Y 了 -m, 则 m= 了 -d, 那 么 (Y-m)?=fY,-( 了 -d)] =[(Y,- Y) 
+d]? =(Y,- Y)? +2d(Y -Y) +。 因此 ,预测 误差 平方 和 ( 见 表 达 式 (3.2) ) 为 : 
> (Y. -m) = > (Y, - D: + 24 Y. (Y. — Y) +nd = y (Y-Y)? tad (3 26) 





其 中 ,第 二 个 等 式 利用 了 y (Y. ~ 了 ) =0 这 - -事实 。 因 为 等 式 (3. 26) 的 最 后 一 个 等 式 中 的 
两 项 都 是 非 负 的 , 旦 前 一 项 不 依赖 于 4d, 所 以 通过 选择 d 使 第 二 项 nd" 尽 可 能 地 小 ,就 能 使 
y (Y, -m)° 最 小 化 。 通 过 设 4=0 BD m= 了 就 能 做 到 这 一 点 ,因此 ,了 是 E( 了 ) 的 最 小 二 乘 
估计 量 。 


[附录 3.3_ 样本 方差 是 一 致 性 估计 量 的 证 骨 - 


本 附录 利用 大 数 定律 证 明 , 当 Y... Y 是 独立 间 分 布 的 且 E(Y1) < + ww 时 ,样本 方差 
SERTA o, 的 -- 致 性 估计 量 , 见 表达 式 (3.8) 中 的 陈述 。 

首先 ,加 上 和 减 去 凡 ， 则 (也 -了 =[(7 -pr) - (F -up = (Y, -pr)* -2(Y, -py) 
(Y-uy) + (了 -pr) ,然后 ,将 表达 式 ( 了 -六 ”代入 到 革 的 定义 ( 见 公式 (3.7) ) 中 ,得 到 ; 


s 0 
:zl 
= È Oad Dp) a Yn) 


-让 LXi ve) ]- (F -a (3.27) 











其 中 ,最 后 ~- 个 等 式 是 根据 了 的 定义 ( 它 意 味 着 > ( -py) =n( 了 -jy)) 再 合并 同类 项 得 
到 的 。 

现在 将 大 数 定律 应 用 到 公式 (3. 27) 最 后 一 行 的 商 项 中 。 EXW, = (了 -py) BLS EW.) 
=g2( 根 据 方差 的 定义 )。 由 于 随机 变量 了 eY, 是 独立 同 分 布 的 ,因此 ,随机 变量 p... W, 
也 是 独立 同 分 布 的。 此 外 ,根据 假设 ECY') < +o, H EW?) ELC, -pyje +a B 
此 ,于 ,…, 现 , 是 独立 同 分 布 的 ， 有 < +o, KA 瑟 满 足 重要 概念 2.6 中 大 数 定律 的 


A.B W—”SE(W.). B W= 1. Y (Y, BEW) = 中 ,所 以 本 于 (y, -D 





o Jbk.aZ(n -1)-1, 因 此 公式 (3.7) 中 的 第 一 项 依 概率 收 全 于 0?。 由 于 了 一 py (Y - 
u) 了 加 ,因此 第 二 项 依 概 率 收 合 于 0。 合 并 这 些 结果 就 可 以 得 出 5 一 a?。 


第 2 部 分 


回归 分 析 基 础 











@ 第 4 章 一 元 线性 回归 A 
@ 第 5 章 ， 多 元 线性 回归 K 
®@ 第 6 章 非 线性 回归 通 数 A 
o 第 7 章 ， 基 于 多 元 回归 的 评估 研究 。 A 
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茶 一 州 政府 对 醉酒 驾 夺 的 司机 实行 新 的 严厉 的 惩罚 措施 ,这 对 高 如 公路 交通 事故 死亡 
率 会 有 什么 影响 ? 一 个 学 区 减 小 小 学 的 班级 规模 ,这 对 该 学 区 学 生 的 标准 化 考试 成 绩 会 有 
什么 影响 ? 体 成 功 地 学 完了 一 年 多 的 大 学 课程 ,这 对 你 将 来 的 收入 会 有 多 大 彩 响 ? 

所 有 这 三 全 问题 都 是 关于 改变 一 个 变量 夺 fi 这 里 站 是 指 对 醉酒 驾车 的 惩罚 、 班 级 规模 和 
受 教 育 年 数 ) 对 另 一 个 变量 了 Y( 这 里 了 是 指 交 通 事 故 死 亡 人 数 、 学 生 考 试 成 绩 和 收入 水 平 ) 
的 末 知 影响 。 

本 章 介绍 将 一 个 变量 下 和 另 一 个 变量 了 联系 起 来 的 线性 国 归 模型 。 这 个 模型 假定 下 
和 YY 之 冰 有 线性 关系 ;联系 站 和 了 的 这 条 直线 的 斜率 就 是 时 的 单位 变化 对 了 的 彩 响 。 正 如 
了 的 均 情 是 了 的 总 体 分 布 的 一 个 未 知 特征 一 样 ,联系 下 和 了 的 这 条 直线 的 斜 夷 也 是 斑 和 了 
的 总 体 联 合 分 布 的 一 个 未 知 特征 。 经 济 计 量 学 问题 就 是 用 这 两 个 变量 的 样本 数据 来 估计 这 
个 插 率 , 即 估计 站 的 单位 变化 对 了 的 影响 。 

本 章 描 述 了 如何 使 用 著 和 了 的 随 抽 样本 数据 对 这 个 回归 模型 进行 统计 推断 的 方法 。 
例如 ,使 用 不 同学 区 的 班级 规模 和 考试 成 绩 数 据 ,我 们 解释 了 如 何 估 计 减 小 班级 规模 (上 比如 
H FATI 名 学 生 ) 对 者 试 成 绩 的 预期 影响 。 普 通 最 小 二 来 (O15) 方 法 可 以 用 来 估计 联 
系 站 和 了 的 这 条 直线 的 斜率 和 截 距 。 此 外 ,普通 最 小 二 乘 估计 量 还 可 被 用 于 检验 总 体 斜 率 
慎 的 假设 (例如 ,检验 减 小 班级 规模 对 考试 成 病 没 有 任何 影响 这 一 零 假 设 ) 和 构造 儿 率 的 重 
AE j, 


4 1 _ 线性 回归 模型 


小 学 学 区 的 教育 主管 想 要 决定 是 否 雇 佣 更 多 的 教师 ,并 就 此 征求 你 的 意见 。 如 果 她 增 
加 亡 佣 教师 ,她 会 使 每 个 教师 对 应 的 学 生 数 (学 生 一 教师 比 ) 减 少 2 人 ,因此 她 面临 着 一 种 
权 黎 选 择 。 家 长 希望 班级 的 规模 较 小 ,以 使 他 们 的 孩子 能 够 得 到 更 多 的 个 别 关 注 , 但 雇佣 更 
多 的 教师 意味 着 要 花费 更 多 的 钱 ,而 这 不 是 那些 掏 钱 的 人 愿意 做 的 事 ! 所 以 她 问 你 ,如 果 她 
减 小 班级 规模 ,对 学 生成 绩 将 会 有 什么 影响 。 








省 多 学 区 部 采用 标准 化 考试 来 测度 学 生 的 成 绩 ,一 些 管理 者 的 职位 升迁 或 报酬 多 少 部 
分 地 依赖 于 他 们 的 学 生 在 这 些 考试 中 的 成 绩 表 现 。 因 此 ,我 们 可 将 该 位 主管 的 问题 具体 明 
确 为 :如 果 她 将 班级 规模 平均 减少 2 名 学 生 , 那 么 这 会 对 本 学 区 标准 化 考试 成 绩 产 生 什 么 样 
的 影响 ? 

对 这 个 问题 的 精确 解答 需要 对 这 里 的 变化 进行 定 基 的 陈述 。 如 果 该 教育 主管 以 某 一 确 
定 的 数量 改变 班级 的 规模 ,那么 ,她 期 望 学 生 的 标准 化 考试 成 绩 会 发 生 怎样 的 变化 呢 ? 我 们 
可 用 希腊 字母 Bas. 将 这 种 关系 表示 成 一 个 数学 关系 ,这 里 设置 下 标 “ CiassSize "的 目的 是 
把 改变 班级 规模 对 学 生 考 试 成 绩 的 影响 和 其 他 影响 区 别 开 来 。 因 此 ; 


B — 考 坛 成 绩 的 变化 _ ATestSeore (4.1) 
conse 班级 规模 的 变化 ”AClassSize i 


其 中 ,希腊 字母 AERE) REEE", PD Bons E H ERARE EA AR 
的 变化 ,再 被 班级 规模 的 变化 来 除 。 

如 果 你 很 幸运 ,知道 6,5. 的 值 ,那么 你 就 能 够 告诉 教育 主管 ,班级 规模 每 减少 1 人 会 
使 整个 地 区 的 考试 成 绩 变 化 Bos..。 和 你 还 可 以 回答 上 面 提 到 的 教育 主管 的 实际 问题 , 即 她 
关心 的 平均 拇 个 班级 减少 2 名 学 生 对 考试 成 绩 的 影响 。 要 回答 这 个 疝 题 ,重新 整理 公式 
(4. L) ,得 到 : 





ATestScore = Banus X MOUSsSize (4.2) 
假如 Boss = -06. 那 么 每 班 平均 减少 2 名 学 生 , 学 生 考 试 成 绩 的 预测 变化 为 { -0.6) x 
{ -2) =1.2, 也 就 是 说 ,如 果 每 班 减少 2 各 学 生 , 你 就 会 预测 到 考试 成 绩 将 会 平均 增加 
1.2 分 。 
公式 (4.1) 是 联系 考试 成 绩 与 班级 规模 的 这 一 直线 斜率 的 定义 。 这 条 直线 可 以 写成 
FS: 


TestScore = fB, + Bensa X Glassue (4.3) 
其 中 ,B 是 这 条 直线 的 截 距 ,如 前 所 述 ,Bo 是 直线 的 斜率 。 根 据 公式 (4.3) ,如 果 你 知道 
Bo 和 Busn, 那 么 你 不 仅 能 够 确定 某 地 区 与 班级 规模 变化 相 联系 的 考试 成 绩 的 变化 ,你 还 
能 够 预测 某 一 给 定 的 班级 规模 其 平均 考试 成 绩 是 多 少 。 
当 你 向 教育 主管 建议 公式 (4.3) 时 ,她 会 告诉 你 这 个 公式 有 问题 。 她 可能 指出 ,班级 规 
模 只 是 影响 小 学 教育 质量 多 方面 因素 中 的 一 个 ,班级 规模 相同 的 两 个 地 区 由 于 许多 原因 会 
有 不 间 的 考试 成 绩 。 一 个 地 区 可 能 拥有 较 好 的 教师 , 也 可 能 使 用 了 较 好 的 教科 书 。 两 个 具 
有 可 比较 的 班级 规模 ,教师 和 教科 书 的 地 区 还 可 能 有 非常 不 同 的 学 生 总 体 。 可 能 一 个 地 区 
有 更 多 的 移民 (这 样 母语 为 英语 的 学 生 就 会 少 ) 或 有 比较 富裕 的 家 庭 。 最 后 ,她 还 可 能 指 
出 ,即使 两 个 地 区 在 以 上 所 有 这 些 方面 都 相同 ,但 由 于 与 个 别 学 生 在 考试 当天 的 表现 有 关 的 
原因 本 质 上 是 随机 的 ,它们 也 可 能 会 有 不 同 的 考试 成 绩 。 当 然 , 她 说 的 是 正确 的 。 由 于 所 有 
这 些 原因 ,公式 (4.3) 不 会 对 于 所 有 的 地 区 都 精确 地 成 立 。 相 反 , 它 应 该 被 看 做 是 平均 起 来 
在 地 区 总 体 间 成 立 的 关于 这 种 关系 的 一 种 表述 。 
要 使 这 种 形式 的 线性 关系 对 每 一 个 地 区 都 成 立 ,必须 加 人 那些 影响 考试 成 绩 的 其 他 因 
素 ,包括 每 个 地 区 独 有 的 特征 ( 如 教师 的 素质 ,学生 的 背景 ,学生 在 考试 那天 的 幸运 程度 等 
等 ) 。 一 种 方法 是 列 出 最 重要 的 因素 ,并 将 它们 明确 地 引入 到 公式 (4.3) 中 (在 第 5 章 我 们 
将 介绍 的 理论 ) 。 但 现在 ,我 们 简单 地 将 所 有 这 些 “ 其 他 因素 ”并 到 一 起 ,将 某 一 特定 地 区 的 


这 种 关系 写 为 : 
TestSeore =, +Benusa X ClassSize + 其 他 因素 (4.4) 


这 样 ,该 地 区 的 考试 成 绩 受 两 个 构成 因素 的 影响 ,一 个 是 代表 学 区 总 体 中 班级 规模 对 考试 成 
绩 的 平均 影响 , 即 8, + Bo... x 班级 规模 , 另 一 个 是 用 代表 所 有 其 他 因素 的 成 分 即 “ 其 他 
因素 ”。 

尽管 这 个 讨论 集中 在 考试 成 绩 和 斑 级 规模 上 ,但 公式 (4.4) 中 所 表达 的 思想 更 具有 一 - 
般 意 义 ,因此 很 有 必要 引 人 更 一 般 的 符号 。 假 设 有 n 个 地 区 的 样本 。 设 了 为 第 i 个 地 区 的 
平均 考试 成 绩 , 设 X, 为 第 i 个 地 区 的 平均 班级 规模 ,并 设 为 第 i 个 地 区 影响 考试 成 绩 的 
其 他 因素 , 那么 对 每 一 个 地 区 而 言 , 即 i=l, e,r, 公式 (4.4) 可 被 更 一 般 地 表 
示 为 ; 

Y. =ø, +ñ X, +u, {4. 5) 
其 中 ,B, 是 这 条 直线 的 截 距 , B, 是 斜率 (公式 (4.5) 中 的 斜率 用 一 般 性 符号 “8B,” 代 震 
“Boasa ” ,因为 这 个 方程 是 按照 一 般 性 变量 艺 来 表示 的 ) 。 

公式 (4.5) 是 一 元 线性 回归 模型 {linear regression model with a single regressor] ,这 
F Y E AEE (dependent variabile ), X Æ Ë W Æ (independent variable j 或 回 妇 因子 
{ regressor) 。 

AA 5) B, + 有 下 ,是 总 体 回归 线 { population regression line) 或 总 体 回 
HE% ( population regression function)。 这 个 平均 意义 上 的 了 上 和 工 之 间 的 关系 ,是 针对 总 
体 而 言 的 。 因 此 ,如 果 你 知道 了 的 值 ,那么 根据 这 个 总 体 回归 线 你 将 会 预测 到 因 变 量 了 的 
IB B, +B,X. 

截 距 ( intəercept)8, 和 斜率 {slopejB 是 总 体 回 归 线 的 系数 { coefficients ) ,也 被 称 为 总 
体 回归 线 的 参数 (parameters) , #E 8, 是 指 与 X 的 单位 变化 相 联 系 的 了 的 变化 。 截 吧 是 
指 当 工 =0 时 ,总 体 回 归 线 的 值 , 它 正 是 总 体 回归 线 与 Y 轴 的 交点 。 在 一 些 经 济 计量 应 用 
中 ,例如 在 4.7 节 中 的 应 用 , 截 距 具 有 一 定 的 经 济 意义 。 然 而 ,在 其 他 的 一 些 应 用 中 , 截 距 没 
有 现实 意义 。 例 如 ,当代 表 班 级 规模 时 ,严格 地 来 讲 , 截 中 就 是 当班 级 里 没有 学 生 时 考试 
成 缤 的 预测 值 。 当 截 距 没 有 现实 意义 时 ,我 们 最 好 在 数学 上 把 它 看 做 是 决定 总 体 回归 线 位 
置 的 系数 。 

公式 (4.5) 中 的 项 是 误差 项 {8rror tem), 误差 项 综合 体现 了 造成 第 i 个 地 区 的 平 
均 考试 成 绩 与 总 体 回归 线 的 预测 值 之 间 差 异 的 所 有 办 于 。 对 一 个 具体 的 观测 值 i 而 言 , 误 
差 项 包含 了 除 工 以 外 的 决定 因 变 量 了 值 变化 的 所 有 其 他 因素 。 在 班级 规模 的 例子 中 , 这 些 
其 他 因素 包括 第 ;个 地 区 中 影响 该 区 学 生 考 试 成 绩 的 所 有 的 独 有 特征 ,包括 教师 素质 .学生 
的 经 济 背景 ,学生 的 幸运 程度 ,甚至 在 考试 评分 中 的 任何 错误 。 

线性 回归 模型 及 其 术语 总 结 在 重要 概念 4. 1 中 给 出 。 

图 4 一 ! 描述 了 考试 成 绩 ( Y) 和 班级 规模 (XX) 之 间 有 7 个 假设 观测 值 的 一 元 线性 回归 模 
型 。 总 体 回 妇 线 是 直线 B, + BE。 总 体 回归 线 向 下 倾斜 , 即 8, <0, 这 意味 着 具有 较 低 的 学 
生 一 教师 比 ( 较 小 的 班级 ) 的 地 区 倾向 于 拥有 较 高 的 考试 成 绩 。 截 只 B, 作为 总 体 回归 线 与 
Y 轴 相 交 的 昨 具 有 数学 上 的 意义 ,但 正如 前 面 所 提 到 的 ,在 这 个 例子 中 它 没 有 现实 
意义 。 

由 于 存在 决定 考试 成 绩 的 其 他 因素 ,因此 ,图 4 一 ! 中 假设 的 观测 值 没有 准确 地 落 在 总 
体 回归 线 上 。 例 如 ,地 区 1 55 Y 8 Y, 在 总 体 回 归 线 的 上 方 。 这 意味 着 在 地 区 1 的 考试 成 线 
要 比 总 体 回 归 线 预测 得 好 ,所 以 该 地 区 的 误差 项 上山 是 正 的 。 相 反 , 闵 在 总 体 回 归 线 的 下 
方 ,所 以 该 地 区 考试 成 绩 要 比 预测 的 差 ,m <0。 
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注 :该 散 点 图 显示 了 7 个 学 区 的 假设 观测 值 。 总 体 回 妇 线 是 内 +BT。 从 第 :点 到 总 体 回 归 线 的 系 
HERE Y, - (A +A. K,) , 它 是 第 i 个 观测 值 的 总 体 误差 项 u. 
图 4 一 ! 考试 成 第 对 学 生 一 教师 比 | 假设 数据 ) 的 散 点 再 


重要 概念 4. 1 
一 元 线性 回 妈 模 型 的 术语 
一 元 线性 回归 模型 是 : 
Y =A +B,X, +u, 
式 中 :下 角 标 站 一 观测 值 的 序号 ,i =1,…,n; 


了 一 一 因 变 量 ,或 称 响 应 变量 ,或 简单 地 称 为 方程 的 左 侧 变量 ; 
X— AFE ,或 称 同 归 因 子 ,或 简单 地 称 为 方程 的 右 侧 变量 ; 
B, + 有 车 一 总 体 回归 线 或 总 体 回 归 画 数 ; 
羽 一 一 总 体 回归 线 的 截 上 距 ; 
肠 一 一 总 体 回 归 线 的 斜率 ; 
4 一 一 误差 项 。 
作为 一 个 教育 主管 的 咨询 顾问 ,现在 回 到 原来 的 问题 中 :以 平均 每 位 教师 减少 2 名 学 生 
的 水 平 来 降低 学 生 一 教师 比 , 它 对 考试 成 绩 的 预期 影响 是 什么 ? 答案 很 容易 :预测 变化 是 
( -2) x Bowsz。 但 Bos 的 值 是 多 少 呢 ? 


[4.2_ 线性 回归 模型 系数 的 估计 - 


在 实际 情况 中 ,比如 在 班级 规模 和 考试 成 绩 的 应 用 例子 中 ,总体 回 归 线 的 截 距 B, TE) 
3 8, 是 未 知 的 ,因此 ,我 们 必须 使 用 数据 估计 总 体 回归 线 的 未 知 斜率 和 截 距 。 

这 个 估计 问题 类 似 于 前 面 统计 学 知识 复习 中 你 曾 面 对 过 的 其 他 问题 ， 例 如 ,假设 你 想 
要 比较 刚 毕 业 的 男女 大 学 生 的 平均 收 人 这 个 例子 。 虽 然 总 体 平均 收入 是 未 知 的 ,但 我 们 能 
够 使 用 男女 大 学 毕业 生 的 随机 样本 估计 总 体 均值 。 例 如 , 女 大 学 生 的 未 知 总 体 平均 收入 的 
自然 估计 量 是 样本 中 女 大 学 毕业 生 的 平均 收入 。 





p. 


同样 的 理论 可 推广 到 线性 回归 模型 中 。 我 们 不 知道 联系 A 班级 规模 ) 和 Y( 考试 成 绩 ) 
的 未 知 总 体 回归 线 的 斜率 Bcss 的 值 ,但 就 像 可 用 从 总 体 中 随机 抽取 的 样本 数据 来 了 解 总 
体 的 均值 一 样 ,我 们 也 可 以 利用 样本 数据 来 了 解 总 体 斜 率 的 值 即 Boys 的 值 。 

这 里 ,我 们 分 析 的 数据 是 由 加 利 福 尼 亚 州 420 个 学 区 1998 年 从 幼儿 园 到 年 级 的 考试 
成 绩 和 班级 规模 所 组 成 的 。 考 试 成 绩 是 整个 地 区 五 年 级 学 生 的 阅读 和 数学 的 平均 成 绩 。 班 
级 规模 可 以 用 各 种 方法 来 测度 。 这 里 用 的 是 最 广泛 的 一 种 测度 , 它 是 地 区 的 学 生 数 除 以 教 
师 数 , 即 整 个 地 区 的 学 生 一 教师 比 。 附 录 4. 1 中 更 详细 地 描述 了 这 些 数据 。 

38 4—1 概括 了 这 个 样本 的 考试 成 绩 和 班级 规模 的 分 布 。 平 均 学 生 一 教师 比 是 19.6 个 
学 生 / 教 师 ,标准 差 是 1.9 个 学 生 / 教 师 。 学 生 一 教师 比分 布 的 第 10 个 百 分 位 数 是 17. 3( 也 
就 是 说 ,只 有 10 名 的 地 区 的 学 生 一 教师 比 低 于 17.3) ,而 该 地 区 学 生 一 教师 比 的 第 90 个 下 
分 位 数 是 21.9。 

表 4 一 1 1998 年 加 利 柱 尼 亚 州 420 个 K 一 8 地 区 的 五 年 级 学 生 考试 成 绩 

和 学 生 一 教师 比分 布 的 汇总 束 

表 分 位 数 
10 25% 40% í ER) 5 75% oN 
17.3 18.6 19.3 19.7 20. 1 20. 9 21.9 
640.0 6439.1 679.1 


关于 学 生 考 试 成 绩 和 学 生 一 教师 比 的 总 计 420 个 观测 值 的 散 点 图 绘制 在 图 4 一 2 中 , 样 
本 相关 系数 是 -0. 23 ,这 表明 了 这 两 个 变量 之 间 具 有 弱 的 负 相 关 关 系 。 虽 然 在 这 个 样本 中 
规模 较 大 的 班级 倾向 于 有 较 低 的 考试 成 绩 , 但 是 一 定 存在 其 他 一 些 快 定 考试 成 绩 的 因素 , 正 
是 这 些 因 素 使 得 观测 值 不 能 完全 落 在 一 条 直线 上 。 
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720 












FEJA | ba df X 








学 生 一 教师 出 | 19.6 








659.4 





630. 4 666.7 





654.5 


700 


880 





10 15 20 25 30 
学 生 一 教师 比 
注 : 该 数据 取 自 于 加 利 福 尼 严 州 的 420 个 学 区 。 在 学 生 一 教师 比 和 考试 成 绩 之 间 存 在 弱 的 负 向 关 


系 ,样本 相关 系数 是 -0 23。 
m 4 一 2 ”考试 成 绩 对 学 生 一 教师 比 ! 加利福尼亚 州 学 区 的 数据 } 的 散 点 图 


尽管 这 个 相关 性 很 低 , 但 是 如 果 一 个 人 能 够 根据 这 些 数据 画 一 条 直线 ,那么 基于 这 些 数 
据 计算 出 来 的 这 条 直线 的 斜率 就 可 以 成 为 Bus 的 估计 值 。 画 这 条 直线 的 一 种 方法 就 是 拿 
出 希 笔 和 尺子 并 用 “眼睛 * 画 出 你 认为 是 最 好 的 直线 。 虽 然 这 种 方法 很 容易 ,但 非 带 不 科 
学 ,不 同 的 人 会 画 出 不 同 的 估计 直线 。 














其 中 , TesiSeore 是 该 地 区 的 平均 考试 成 绩 STR 是 学 生 一 教师 比 。 公 式 {4.7) 中 TesiScore 上 
的 符号 “一 ~“ 表示 这 是 基于 普通 最 小 二 药 回 归 线 的 预测 值 。 攻 4 一 3 绘 出 了 加 在 图 4 一 2 
数据 散 点 图 之 上 的 最 小 二 乘 回 归 线 。 


° <s °. TestScore=698.9-2.28 x STR 





30 
学 生 一 教师 比 
注 : 这 条 估计 的 回归 线 显示 了 考试 成 绩 和 学 生 一 教师 比 之 间 的 负 向 关系 。 如 果 班 级 规模 减少 1 名 
学 生 , 所 估计 的 回归 预测 考试 成 绩 会 提高 2. 28 分 。 
图 4 一 3 ”根据 加 利 福 尼 亚 州 数据 所 估计 的 回 妆 线 


重要 概念 4. 2 


昔 通 最 小 二 乘 估计 是、 预测 值 和 残 头 
斜率 8, RREA 的 普通 最 小 二 恨 估 计量 是 ， 


Yun, - 
â- E 


s 
ya, - Xy: š ° 
ñ =Y-AX (4.9) 
FARN RAAME Í, 05925 i, E: 
$ =Â +Â X i21, e,n (4. 10) 
pl (4. 11) 


所 估计 的 裁 距 {高 ) .斜率 ( 房 ) 和 残 差 (二 ) 是 根据 工 和 ,i=1,…,n 的 个 观测 值 样 
本 计算 出 来 的 ,它们 是 总 体 中 未 知 的 真实 截 距 ( 记 ) ,真实 斜率 (有 ) 和 真实 误差 项 (w,) 的 个 
HË. 

-2.28 的 斜率 值 意味 着 ,平均 来 看 ,在 一 个 班级 中 ,学 生 一 教师 比 每 增加 1 个 单位 , 整 
个 地 区 的 考试 成 绩 将 下 降 2. 28 分 。 因 此 ,平均 来 看 ,每 一 个 班级 的 学 生 一 教师 比 每 减少 2 
个 单位 ,整个 地 区 的 考试 成 绩 将 增加 4. 56( -2) x ( -2.28) ,二 者 是 有 密切 联系 的 。 负 的 斜 
率 表明 , 较 大 的 学 生 一 教师 比 ( 即 较 大 的 班级 ) 与 较 差 的 考试 成 绩 联系 在 一 起 。 

现在 ,给 定 学 生 一 教师 比 的 值 ,就 可 以 预测 整个 地 区 的 考试 成 绩 。 例 如 ,对 一 个 学 生 一 
教师 比 为 20 的 地 区 而 言 ,所 预测 的 考试 成 绩 为 698.9 -2. 28 x20 = 653.3。 当 然 ,由 于 存在 
决定 该 地 区 考试 成 绩 的 其 他 因素 ,因此 ,这 个 预测 不 会 是 非常 准确 的 。 但 在 不 考虑 其 他 因素 














的 情况 下 ,回归 线 的 确 给 出 了 基于 党 生 一 教师 比 数据 该 地 区 考试 成 绩 将 会 是 多 少 的 预测 
(普通 最 小 二 乘 预测 ) 。 

这 个 笠 率 的 估计 值 是 大 还 是 小 呢 ? 为 了 回答 这 个 问题 ,我 们 回 到 教育 主管 的 问题 上 。 
回想 一 下 ,她 正 考 处 雇 佣 足 够 多 的 教师 ,以 使 学 生 一 教师 比 减少 2 个 单位 。 假 设 她 所 在 地 区 
的 学 生 一 教师 比 处 在 加 利 福 尼 亚 地 区 的 中 位 数 上 上 。 册 表 4 一 1 可 知 ,学 生 一 教师 比 的 中 位 数 
是 19.7, 考 试 成 绩 的 中 位 数 是 654. 5。 每 个 班 减少 2 名 学 生 , 从 19.7 降 到 17, 7 ,会 使 其 学 生 
一 教师 比 从 第 50 个 百 分 位 数 移动 到 非常 接近 于 第 10 个 百 分 位 数 的 位 置 。 这 是 个 很 大 的 变 
化 ,她 将 需要 雇佣 许多 新 教师 。 这 会 对 考试 威 绩 有 什么 影响 呢 ? 

根据 公式 (4. 7) ,预测 学 生 一 教师 比 前 减 2 个 单位 会 使 考试 成 绩 大 约 增加 4.6 分 ; 如果 
该 地 区 的 考试 成 绩 在 中 位 数 654. 5 上 ,那么 预测 考试 成 绩 将 增加 到 659. 1。 这 个 提高 是 大 
还 是 小 呢 ? 根据 表 4 一 1 ,这 个 提高 会 使 该 地 区 从 中 位 数 移 到 刚好 低 于 第 60 个 百 分 位 数 的 
地 方 。 这 样 ,班级 规 借 减 小 到 使 该 地 区 接近 于 最 小 班级 的 10 免 会 使 考试 成 绩 从 第 50 个 百 
分 位 数 上 升 到 第 0 个 百 分 位 数 。 根 据 这 些 估 计 值 ,大 幅度 前 减 学 生 一 教师 比 (2 个 单位 ) 起 
码 是 有 帮助 的 ,并 且 可 能 是 值得 佑 的 ,但 最 终 要 取决 于 地 所 管辖 学 校 的 财务 预算 情况 ,并且 
它 不 会 是 灵丹妙药 。 

如 果 这 位 教育 主管 正 考虑 一 个 更 根本 的 变化 , 出 如 ,将 学 生 一 教师 比 从 20 降 到 5 会 如 
何 ? 不 幸 的 是 ,公式 (4.7}) 中 的 估计 值 对 她 不 基 很 有 用 。 这 个 回归 是 使 用 图 4 一 2 中 的 数据 
梧 计 的 ,正如 图 形 所 示 , 在 这 些 数 据 中 最 小 的 学 生 一 教师 比 是 14。 这 些 数 据 不 包含 关于 极 
小 班级 地 区 的 学 生 表现 的 信息 ,所 以 这 些 数据 本 身 并 不 能 对 这 种 根本 性 变化 提供 一 个 可 靠 
的 预测 基础 , 即 预测 学 生 一 教师 比 由 一 个 普通 的 水 平 变 到 一 个 极 低 的 水 平 所 带 来 的 影响 。 


一 般 兴 趣 杠 
股票 的 "贝塔 

现代 金融 学 的 基本 思想 是 投资 者 需要 有 一 个 财务 动机 来 头 担 风险 。 换 句 话说 ,风险 投 
资 的 期 望 收 益 率 ?R 必须 超过 安全 的 或 无 风险 投资 的 收益 率 忆 。 因 此 ,一 笔 风险 投资 (比如 
持 有 某 公司 的 股票 ) 的 预期 超额 收益 率 , 即 足 -总 ,应 该 是 正 的 。 

乍 看 起 来 ,好 像 应 该 用 股票 的 方差 测度 它 的 风险 。 然 而 ,这 种 风险 可 以 通过 在 "投资 组 
合 " 中 持 有 其 他 的 股票 来 降低 ,也 就 是 说 ,通过 金融 资产 多 样 化 的 方式 来 降低 大 部 分 风险 。 
ZERE ,测度 股票 风险 的 正确 方法 不 是 用 它 的 方差 而 是 用 它 与 市 场 的 协 方差 。 

资本 资产 定价 模型 { CAPM ) 将 这 一 思想 模型 化 。 根 据 CAPM ,一 项 资产 的 预期 超额 收 
益 率 与 所 有 可 获得 的 资产 组 合 (“市 场 组 合 ”) 的 预期 超额 收益 率 成 比例 。CAPM 告诉 我 们 : 

R-R.=B(R, - R.) (4.12) 

其 中 ,R。 为 市 场 组 合 的 期 望 收 益 率 ,6 是 总 体 回归 中 只 -局 对 如 - R, 回归 的 系数 。 实 际 
中 ,无 风险 利率 通常 取 短期 美国 政府 债券 的 利率 。 根 据 CAPM, g < 1 的 股票 其 风险 低 于 市 
场 投资 组 合 的 风险 ,因此 应 该 搜 有 上 比 市 场 投 赛 组 合 低 的 预期 超额 收益 率 。 相 反 ,B> 1 的 股 
票 其 风险 高 干 市 场 投资 组 合 的 风险 ,因而 应 该 要 求 所 有 更 高 的 预期 超额 收益 率 。 

实际 上 ,股票 的 “Beta" 已 成 为 投资 业 的 一 匹 " 载 重 马 ” ,在 投资 公司 的 网 站 上 你 能 够 获 
得 上 百 只 股票 的 B 估计 值 。 这 些 8 值 都 是 用 股票 的 实际 超额 收益 率 对 综合 市 场 指数 的 实际 
超额 收益 率 进 行 普 通 最 小 二 乘 回归 估计 得 到 的 。 

表 4--2 给 出 了 六 只 美国 股票 的 8 估计 值 。 低 风险 的 消费 品 生产 公司 具有 低 8 值 的 股 
票 , 像 Kellogg 公司 5 高 风险 的 高 科技 股票 具有 离 的 B 值 ,比如 微软 公司 。 


表 4 一 2 六 只 美国 股票 的 召 值 估计 





























公司 tiith e tE 
Kellogg( 早餐 食品 公司 ) 0.24 
Waste Management( 废物 处 理 公 司 ) 0.38 
Sprint( 长 途 电话 公司 ) 0.59 
Walman( 折扣 零售 商 ) 0.89 
Bares and Noble( E 53828 08) 1.03 
Best Buy( 电子 设备 零售 商 ) 1.80 
Microsoft( 软件 ) 1.83 


资料 来 源 . Yahoo, com. 

注 :中 一 笔 投资 的 收益 率 ,是 该 笔 投 资 的 价格 变化 加 上 任何 来 自 于 该 笔 投资 的 股息 或 红利 ,被 初始 价 
格 来 除 的 百分比 。 赂 如 ,一 只 在 1 月 1 日 以 100 美元 买 和 的 股票 ,在 这 一 年 中 支付 红利 2.50 美元 ,并 在 12 
月 31 日 以 105 美元 卖 出 , 则 收益 率 为 史 =1105 — 100 +2.50) =100= 7. 5% , 


4.2.3 为 什么 使 用 OLS 估计 量 


使 用 OLS 估计 量 房 MA . 既 有 实践 原因 ,也 有 理论 原因 。 因 为 0LS 是 在 实践 中 普遍 使 
用 的 方法 , 它 已 成 为 整个 经 济 学 .金融 学 ( 见 前 面 的 一 般 兴趣 框 ) 和 社会 科学 中 回归 分 析 的 
最 一 般 的 通用 语言 。 使 用 OL 法 (或 本 书后 面 讨论 的 它 的 变形 ) 提 交 报告 ,意味 着 你 与 其 他 
的 经 济 学 家 和 统计 学 家 “有 共同 语言 "。 实 际 上 ,OLS 公式 已 被 编程 至 所 有 的 电子 表格 和 统 
计 软 件 包 , 使 用 起 来 非常 方便 。 

此 外 ,OLS 估计 量 还 具有 良好 的 理论 土 的 优点 。 例 如 ,样本 均值 了 是 均值 ECY) 的 无 偏 
估计 量 , 即 ECY) =u, Y Æ uy 的 一 臻 性 估计 量 ;在 大 样本 下 ,了 的 抽样 分 布 是 近似 于 正 态 分 
布 (3.1 6). OLS AHE A, MÂ 也 具有 这 些 性 质 。 在 一 组 普通 的 假设 下 (4. 3 节 中 所 陈述 
的 ) À, añ, Ee 和 有 无 偏 的 .一 致 的 估计 量 , 它 们 的 抽样 分 布 是 近似 于 正 态 的 。 这 些 结 
果 将 在 4 4 节 中 讨论 。 

了 还 有 另外 一 个 良好 的 理论 优点 ,在 开 。…, 到 的 线性 函数 佑 计量 中 , 它 是 有 效 的 , 即 在 
所 有 的 Y... Y. 的 加 权 平 均 估 计量 中 , 它 具 有 最 小 的 方差 { 见 3. 1 节 ) 。 类 似 的 结论 也 适用 
于 0LS 佑 计量, 但 这 个 结论 要 求 另外 一 个 假设 条 件 ,因为 它 超出 了 1.3 节 中 的 假设 条 件 范 
围 ,所 以 我 们 将 把 这 个 讨论 推迟 到 第 4.9 节 中 论述 。 


43 最 小 二 乘法 的 假设 条 件 - 


本 节 介 绍 了 线 几 回归 模型 的 三 个 假设 条 件 和 抽样 方案 。 在 这 个 抽样 方案 下 ,OILS 为 未 
知 回归 参数 B, 和 局 提供 了 一 个 合适 的 估计 量 。 最 初 ,这 些 假 设 可 能 看 起 来 是 抽象 的 ,不 过 
它们 确实 有 自然 的 含义 。 理 解 这 些 假设 ,对 把 握 OLS 方法 什么 时 候 能 够 对 回归 系数 给 出 有 
用 的 估计 值 、 什 么 时 候 给 出 无 用 的 估计 值 , 是 非常 必要 的 。 


4.3.1 RRL RE X, u, 的 条 件 分 布 的 均值 为 堆 
第 一 个 最 小 二 乘 假设 1least squares assumption) E, HE X, BATF u 的 条 件 分 布 的 














均值 为 零 。 这 个 假设 是 关于 包含 其 他 因素 "2 的 一 个 正式 的 数学 陈述 ,并 断言 这 些 其 他 因 
REX 无 关 , 也 就 是 说 ,给 定 下 的 值 ,这 些 其 他 因素 分 布 的 均值 为 零 。 

这 在 图 4 一 4 中 进行 了 说 明 。 总 体 回归 线 是 平均 来 看 总 体 中 班级 规模 和 考试 成 绩 之 间 
成 立 的 关系 ,误差 项 u, 代表 了 导致 给 定 地 区 的 考试 成 绩 不 同 于 总 体 回 归 线 预测 值 的 其 他 因 
素 。 如 图 4 一 4 所 示 ,对 于 一 个 给 定 的 班级 规模 的 值 , 比如 说 每 班 20 名 学 生 , 有 时 这 些 其 他 
因素 会 导致 比 预测 更 好 的 成 绩 (u >0) ,而 有 时 还 会 导致 比 预 测 更 差 的 成 绩 (u, <0) ,但 平均 
来 看 ,对 总 体 的 预测 是 正确 的 。 摘 和 钉 话 说 ,给 定 谍 .=20,u, 分 布 的 均 导 和 是 零 。 在 图 4--4 中 ， 
这 一 点 被 显示 为 z 的 分 布 集中 在 下 =20 处 的 总 体 回 归 线 的 周围 。 更 一 般 地 讲 , 在 X, 的 其 
他 值 x 处 也 如 此 , 换 甸 话说 ,在 X=x 的 条 件 下 ,u 的 分 布 的 均值 为 零 。 用 数学 语言 表达 , 即 
E(u, |X, =x) =0, 或 用 更 简单 的 符号 E(w lX.) =0。 

如 图 4-4 R, EC X) =0 这 一 假设 ,与 总体 回归 线 是 给 定 互 时 工 的 条 件 均值 ” 
《数学 证 明 角 作 练 习 4. 3) 这 一 假设 是 等 价 的 。 


考试 成 绩 
720 









当 =15 时 了 了 的 分 布 
S 当 X=20 时 了 的 分 布 


700 


34 X=25J 了 的 分 布 





E(Y|X=20) 





E(Y|X=25) B, + AX 






ao -— PHI 
E 显示 了 班级 规模 为 15 名 .20 名 和 25 名 学 生 的 学 区 考试 成 绩 的 条 件 概率 。 给 定 学 生 一 
教师 出 ,考试 虚 续 条 件 分 布 的 均值 ECYIXY) 就 是 总 体 回归 线 品 +8 X. 在 给 定 王 值 之 处 ,了 是 围绕 回归 
线 分 布 的 ,误差 w= 了 - (B, +B6,X) 对 所 有 的 XX 值 都 具有 条 件 零 均值 ， 
图 4 一 4 亲人 忻 概率 分 布 和 和 总体 回 归 钱 
相关 性 与 条 件 均 值 。 回 忆 2. 3 节 的 内 容 , 如 果 一 个 随机 变量 在 给 定 另 一 个 随机 变量 条 
忻 下 的 条 件 均值 为 零 ,那么 这 两 个 随机 变量 的 协 方差 为 零 , 进 而 是 不 相关 的 (公式 (2. 25))。 
因而 ,条 件 均值 假设 E(u X) =0 ERA X, 和 是 不 相关 的 或 cor( 夺 ,wu,) =0。 因 为 相关 
性 是 线性 关联 性 的 一 种 测度 ,所 以 这 个 含义 反 过 来 是 不 成 立 的 。 即 使 蒜 与 点 不 相关 ,给 定 
X, #f F u, 的 条 件 均 值 可 能 也 是 非 零 的 。 不 过 ,如 果 艺 和 是 相关 的 ,那么 E(u | X.) — 
定 是 非 零 的 。 因 此 ,就 了 与 上 之 间 可 能 的 相关 性 来 讨论 条 件 均值 假设 是 很 方便 的 。 如 果 
X, 5 u, 是 相关 的 ,那么 条 件 均值 假设 就 被 违背 了 。 


4.3.2 R2: (X,Y), G =1, e n) Eha EAn EJ 


第 二 个 最 小 二 乘 假设 是 , (下 ,了 ) ,i=1,…,n 在 观测 值 之 间 是 独立 同 分 布 的 (Li d. )。 
如 2.5 节 { 兄 重要 概念 2.5) 中 所 讨论 的 ,这 一 假设 是 关于 如 何 抽取 样本 的 中 述 。 如 果 使 用 
简单 随机 抽样 从 单个 大 总 体 中 抽取 观测 信 , 那么 (X,Y ) ,i =1,…,n, 就 是 独立 同 分 布 的 。 
例如 , 设 世 是 工人 的 年 龄 ,了 是 他 或 她 的 收入 ,并且 假设 从 工人 总 体 中 随机 地 抽取 一 个 工人 。 


那个 被 随机 抽取 的 工人 会 有 一 个 确定 的 年 龄 和 收入 {( 即 式 和 了 会 取 某 个 值 ) 。 如 果 从 这 个 
DEPRE na LARERE, BAY) ,i=1,…,n, 必 定 具 有 相同 的 分 布 ,并 且 如 果 它 们 
是 被 随机 抽取 的 ,那么 它们 在 前 后 观测 值 之 间 也 是 独立 分 布 的 , 即 它们 是 独立 同 分 布 的 。 

对 许多 数据 收集 方案 而 言 ,独立 同 分 布 假设 (ii d. ) 是 个 合理 的 假设 。 例 如 ,从 一 个 总 
体 里 随机 选择 的 样本 中 得 到 的 调查 数据 ,可 被 典型 地 看 做 是 独立 同 分 布 的 。 

然而 ,并 不 是 所 有 的 抽样 方案 得 到 的 观测 值 (多,Y,) 都 是 独立 同 分 布 的 。 举 一 个 例子 ， 
的 值 不 是 从 总 体 里 随机 抽取 的 样本 中 得 到 的 ,而 是 由 研究 人 员 将 其 作为 试验 的 一 部 分 来 
设 定 的 。 例 如 ,假设 一 位 园艺 家 想 研 究 不 同 的 有 机 除草 方法 (XX) 对 西红柿 产量 (了 ) 的 影响 ， 
于 是 她 会 在 种 植 不 同 西红柿 的 地 块 上 施用 不 同 的 有 机 除草 技术 。 如 果 她 选择 某 项 技术 (区 
的 水 平 ) 用 在 第 ; 块 地 上 , 并 在 所 有 的 重复 试验 中 将 同样 的 技术 应 用 于 第 # 块 地 ,那么 总 的 
值 在 不 同样 本 之 间 是 不 变 的 。 这 样 , 乱 是 非 随机 的 (尽管 结果 了 是 随机 的 ) ,所 以 该 抽样 方 
案 不 是 独立 同 分 布 的 。 如 果 回 归 因 子 是 非 随机 的 (这 将 在 第 15 章 中 进一步 讨论 ) ,那么 ,在 
RAX iid 回归 因子 导出 的 结果 也 同样 是 适用 的 。 不 过 , 非 随机 回归 因子 的 情况 是 相当 
特殊 的 。 例 如 ,现代 实验 方案 会 使 园艺 家 利用 计算 机 化 的 随机 数 发 生 器 把 * 的 水 平分 配 到 
不 同 的 地 块 ,因而 避免 了 由 园艺 家 所 造成 的 可 能 仿 差 (她 可 能 会 对 阳光 充足 的 地 块 上 的 西 
红 柿 使 用 她 喜欢 用 的 除草 方法 ) 。 当 使 用 这 种 现代 的 实验 方案 时 , 工 的 水 平 就 是 随机 的 , 因 
此 (了 ) 是 独立 同 分 布 的 。 

非 独立 同 分 布 抽样 的 只 一 个 例子 是 , 当 观 测 什 是 从 同一 个 观察 单位 在 不 同 的 时 间 抽 取 
的 ,这 时 就 可 能 产生 非 独 立 同 分 布 的 样本 。 例 如 ,我 们 可 能 会 有 关于 某 公 司 的 存货 水 平 (了 ) 
的 数据 和 该 公司 异 款 利率 {XX) 的 数据 ,这 些 数 据 是 在 不 同 的 时 间 从 某 个 特定 的 公司 中 收集 
的 。 比 如 ,这 些 数据 可 能 被 连续 记录 了 30 年 ,每 年 四 次 ( 按 季 度 ) 。 这 是 个 时 间 序 列 数 据 的 
例子 。 时 间 序 列 数据 的 一 个 重要 特征 是 ,在 时 间 上 彼此 接近 的 观测 值 之 间 不 是 独立 的 ,而 是 
倾向 于 相关 的 。 如 果 现 在 利率 水 平 较 低 ,那么 它们 在 下 个 季度 可 能 也 较 低 。 这 种 相关 性 的 
模式 ,违背 了 独立 同 分 布 假设 中 “独立 性 "部 分 的 内 容 。 时 间 序 列 数据 引出 了 一 系列 复杂 的 
问题 ,这些 问题 最 好 是 在 介绍 完 回 归 分 析 的 基本 工具 之 后 再 做 处 理 , 所 以 我 们 将 时 间 序 列 的 
进一步 讨论 推迟 到 第 4 部 分 。 


4.3.3 假设 3:; 互 和 zu 拥有 四 阶 矩 


第 三 个 最 小 二 乘 假设 是 ,不 Mu 拥有 非 零 的 有 限 的 四 阶 矩 (0 < E( XI) < +w 和 0 < E 
(u) < +e ) ,或 者 说 , 和 的 四 阶 矩 是 非 零 的 和 有 限 的 。 这 个 恨 设 限制 了 抽取 到 极 大 
B X E u, 观测 值 的 概率 。 如 果 我 们 抽取 到 一 个 极 大 的 达 或 了 的 观测 值 ,也 就 是 说 ,或 
Y, 远 在 数据 的 正 态 分 布 范围 之 外 ,那么 ,这 个 观测 值 在 OLS 回归 中 当然 会 被 给 予 很 大 的 重 


视 , 从 而 导致 令 人 误解 的 回归 结论 。 
有 搬 四 阶 托 的 假设 ,在 数学 意义 上 证 明了 OLS 检验 统计 量 分 布 的 大 样本 逼近 是 合理 
的 。 我 们 在 第 3 章 讨论 样本 方差 一 致 性 时 曾经 遇 到 过 这 个 假设 。 具 体 来 说 ,等 式 (3.8) 表 


明 , 样 本 方差 是 总 体 方差 o 的 一 致 估计 量 { 即 号 一 at) WME N, Y, 是 独立 同 分 
布 的 ,” 的 四 阶 矩 是 有 限 的 ,那么 ,在 重要 概念 2.6 中 阐述 的 大 数 定律 也 适用 子平 均 数 


+Y (Y. -Ar) ,这 是 在 附录 3.3 中 证 明 sy 是 一 致 性 估计 量 过 程 中 的 一 个 关键 步骤 。 关 于 
四 阶 矩 的 假设 在 OLS 回归 数学 理论 中 的 作 有 由 ,将 在 15.3 节 中 做 进一步 的 讨论 。 








计 基 , 即 样本 均值 子 的 抽样 分 布 的 讨论 。 由 于 了 是 使 用 随机 抽取 的 样本 计算 的 ,因此 子 是 
个 随机 变量 , 随 着 样本 的 不 同 而 取 不 同 的 值 ,这 些 不 同 值 的 概率 体现 在 它 的 抽样 分 布 中 。 尽 
管 当 样本 容量 很 小 时 ,了 的 抽样 分 布 可 能 是 复杂 的 ,但 给 出 对 于 所 有 的 = 都 成 立 的 确定 性 的 
分 布 陈述 却 是 可 能 的 ,尤其 是 抽样 分 布 的 均值 是 Ar BD E(Y) =jy, 所 以 了 是 jy 的 无 偏 估 计 
量 。 如 果 a 很 大 ,那么 对 于 抽样 分 布 能 够 总 结 的 结论 更 多 ,尤其 重要 的 是 ,中 心 极限 定理 
( 见 2.6 节 ) 表 明了 这 个 分 布 是 渐 近 正 态 的 。 

ñ, MG, 的 抽 村 分 外 ”以 上 这 些 理论 ,仍然 可 以 应 用 到 总 体 回 归 线 未 知 截 距 B 和 未 知 
斜率 B, 的 OLS EHE ñ, 和 启 的 分 布 上 。 由 于 OLS 估计 量 是 使 用 随机 样本 计算 的 ,因此 遍 
和 房 是 随机 变量, 随 着 样本 的 不 同 而 取 不 同 的 值 ,这 些 不 同 值 的 概率 体现 在 它们 的 抽样 分 
布 中 。 

尽管 当 样本 容量 很 小 时 ,成 和 启 的 抽样 分 布 可 能 是 复杂 的 ,但 给 出 对 于 所 有 的 n 都 成 
立 的 确定 性 的 分 布 陈述 却 是 可 能 的 。 特 别 是 记 = ñ, 的 抽样 分 布 的 均值 是 p 和 局 。 换 名 
话说 ,在 重要 概念 4 3 中 的 最 小 二 乘 假 设 下 : 

EP) =B E(B) =B, (4. 13) 
BBA, MÂ, E 8, 和 有 的 无 偏 估 计 其 。 关 于 是 无 偏 的 这 一 结论 的 证 明 在 附录 4.3 中 给 
出 ,而 关于 所 是 无 偏 的 这 一 结论 的 证 明 留 作 练 习 4.4, 

如 果 样本 足够 大 ,那么 根据 中 心 极限 定理 ,B 和 所 的 抽样 分 布 可 很 好 地 被 二 元 正 态 分 
布 逼 近 ( 见 2. 4 节 )。 这 意味 着 在 大 样本 条 件 下 ,所 M 的 边 绿 分 布 是 正 态 的 。 

这 个 论证 需要 异 助 于 中 心 极 限定 理 。 从 技术 上 说 ,中 心 极 限定 理 主要 涉及 平均 值 ( 比 
如 怒 的 分 布 。 如 果 你 研究 一 下 公式 (4.8) 中 局 的 分 于 ,你 就 会 发 现 它 也 是 一 种 平均 数 一 一 
不 是 像 了 那样 的 篇 单 平均 数 ,而 是 一 个 乘积 (了 . - 了) {X,-) 的 平均 数 。 如 同 附录 4.3 中 进 
一 步 讨论 的 ,中 心 极限 定理 也 适 基于 这 个 平均 数 , 像 简单 平均 数 了 一 样 ,在 大 样本 条 件 下 它 
也 服从 正 态 分 布 。 

关于 大 样本 条 件 下 OLS 估计 量 分 布 的 正 态 近 伺 总 结 在 重要 概念 4. 4 中 给 出 (附录 4.3 中 
概要 地 给 出 了 这 些 公式 的 推导 )。 一 个 实践 中 的 重要 问题 是 ,n 取 多 大 时 这 些 近 似 才 是 可 靠 
的 。 在 2.6 节 中 ,对 于 了 的 抽样 分 布 怎样 才能 很 好 地 被 正 态 分 布 所 逼近 这 一 问题 ,我 们 建议 
= 100 是 足够 大 的 ,有 时 较 小 的 也 能 满足 要 求 。 这 个 准则 可 继续 应 用 到 回归 分 析 中 出 现 的 
更 加 复杂 的 平均 数 上 。 实 际 上 在 所 有 现代 经 济 计 量 应 用 中 ,一 般 总 是 有 n > 100, 所 以 我 们 将 
把 OLS 佑 计量 分 布 的 正 态 近 似 看 做 是 可 靠 的 ,除非 有 很 好 的 理由 认为 它 不 是 正 态 分 布 。 


重要 概念 4. 4 
Â MÅ 的 火 样本 分 布 
如 果 重 要 概念 4.3 中 的 最 小 二 乘 假设 成 立 , 那 么 在 大 样本 条 件 下 , 房 fi ñ, 服从 联合 正 
态 抽 样 分 布 。 Ê, 的 天 样本 正 态 分 布 是 N(B; ,0 ) ,其 中 这 个 分 布 的 方差 oh H: 


var[ (X, “pr)w, 
EENIG (4.14) 


ñ, 的 天 样本 正 态 分 布 是 N(A, srh ) ;其 中 : 
: BEH, =1- [ z Ja, (4.15) 


1 
ch = 














重要 概念 4.4 中 总 结 的 结果 表明 ,OLS 估计 量 是 一 致 的 ,也 就 是 说 , 当 样本 很 大 时 , 记 
mñ, 将 会 以 很 高 的 概率 过 近 于 真实 总 体系 数 B。 和 8,。 这 是 因为 随 着 n 的 增 大 ,估计 量 的 
方差 hM RODAR 出 现在 方差 表达 式 的 分 母 中 )。 所 以 当 n 很 大 时 ,OLS 估计 量 的 
分 布 将 紧 紧 地 集中 在 它们 的 均值 8。 和 局 的 周围 。 

重要 概念 4.4 中 给 出 的 大 样本 分 布 的 另 一 个 意义 是 ,一 般 来 说 盛 的 方差 越 大 , 包 的 方 
差 0 就 越 小 。 从 数学 上 看 ,因为 等 式 (4.14) 中 启 的 方差 与 的 方差 平方 成 反比 ,所 以 ， 
var(X,) 越 大 ,等 式 (4. 14) 中 的 分 母 就 越 大 ,o3 就 越 小 。 为 了 更 好 地 理解 为 什么 会 是 这 样 的 
原因 ,请 看 图 4 一 5, 这 个 图 绘 出 了 关于 了 和 了 的 150 个 人 工 数据 点 。 用 彩色 点 表示 的 数据 
SERRO X MT 个 观测 值 。 假 如 让 你 尽 可 能 精确 地 画 出 一 条 经 过 彩色 点 或 黑色 点 的 直 
线 ,你 是 选择 经 过 彩色 点 的 直线 还 是 选择 经 过 黑色 点 的 直线 ? 通过 黑色 点 会 比较 容易 地 面 
出 一 条 精确 的 直线 , 它 具 有 比 彩 色 点 更 大 的 方差 。 同 理 ,X 的 方差 越 大 ,局 的 值 就 越 精确 。 
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Êo 和 启 的 抽样 分 布 正 态 近似 是 一 个 非常 有 力 的 工具 。 有 了 这 个 近似 ,我 们 就 能 够 设计 
出 上 只 使 用 样本 数据 就 能 够 对 回归 系数 的 总 体 真 值 进行 推断 的 方法 。 


45 _ 检验 单个 回归 系数 的 假设 ] 


你 的 一 个 客户 ,也 即 前 例 中 的 那 位 教育 主管 ,给 你 打 电 话 咨询 一 个 问题 。 在 她 的 办 公 室 
里 正 有 一 位 慎 怒 的 纳税 人 ,他 声称 前 减 班级 规模 对 考试 成 绩 没 有 帮助 ,因此 进一步 地 减 小 班 
级 规模 是 在 浪费 资金 。 这 位 纳税 人 声称 班级 规模 对 考试 成 绩 没 有 影响 。 

这 位 纳税 人 的 主张 能 用 回归 分 析 的 语言 重新 表述 。 由 于 班级 规模 的 单位 变化 对 考试 成 
绩 的 影响 是 Bouse ,因此 这 位 纳税 人 声称 的 结论 意味 着 总 体 回归 线 是 平坦 的 ,也 就 是 说 ,总 
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ob. = " E - (4.19) 
rye, - 27] 
公式 (4. 89) 中 的 方差 估计 量 在 附录 4.4 中 做 了 讨论 。 尽 管 os 的 表达 式 很 复杂 ,但 因为 在 
应 用 中 用 回归 软件 计算 标准 误 , 所 以 在 实际 中 它 是 比较 容易 计算 的 。 
第 二 步 是 计算 上 统计 量 。 





t= Ê -Bio -By (4.20) 
SE(Ĝ) 


第 三 步 是 计算 p 值 , 即 当 假 定 零 假设 为 真 时 ,观察 到 的 房 值 至 少 和 实际 计算 的 估计 值 

( 房 ") 一 样 不 同 于 A 。 的 概率 。 数 学 上 表述 为 ; 

p~ 值 =Prw[ lÂ, -8i o >Ê -p10] 

= Pra | À -Bo br- 
SELB) T 

其 中 ,Pr 表示 在 零 假 设 下 所 计算 的 概率 ,第 二 个 等 式 通 过 除 以 SE 4831, 1” 为 实际 所 
计算 的 1 统计 量 的 值 。 因 为 在 大 样本 条 件 下 ,Bi 服从 渐 近 正 态 分布 , 所 以 在 零 假设 下 ,! 统计 
量 是 个 渐 近 服从 标准 正 态 分 布 的 随机 变量 。 因 此 ,在 大 样本 条 件 下 有 

p ÎE = Pr IZI >ei) =2@( - 121) (4 22) 

一 个 很 小 的 p W, EAA T 5% ,提供 了 反对 零 假设 的 证 据 ,其 意义 是 说 ,如 果实 际 上 
零 假 设 是 真 的 , 则 从 各 个 纯 随机 抽 事 的 样本 中 获得 的 应 值 的 机 会 小 于 5 和 。 如 果 是 这 样 的 
话 , 零 假设 则 在 5% 的 显著 性 水 平 下 被 拒绝 。 

另 一 种 方法 是 ,通过 简单 地 比较 i; 统计 量 的 值 和 双边 检验 的 临界 值 +1.96 ,在 5% 55 84 
著 性 水 平 下 检验 零 假 设 。 如 果 12”1 >1.96, 那 么 就 在 5 名 的 显著 性 水 平 下 扩 绝 零 假设 。 

这 几 个 步 又 被 总 结 在 重要 概念 4.65 rh. 

应 用 于 考试 成 绩 这 个 例子。 使 用 图 4 一 2 中 的 420 个 观测 秆 所 估计 的 ,并 在 公式 (4.7) 
中 所 报告 的 斜率 系数 的 OLS 全 计量 是 ~2.28。 它 的 标准 误 是 0.52, 艺 SE(8,) =0.52。 因 
而 ,为 了 检验 零 假设 AQ u =0, 我 们 使 用 公式 (4.20) 构 造 ; 统 计量 。 因 此 ,这 =( -2.28~ 
0) +0.52 = -4.38。 

这 个 1 统计 量 超 过 了 1 免 的 双边 临界 秆 2.58, 所 以 在 1 名 的 显著 水 平 下 拒绝 零 假 设 , 支 
持 备 择 假 设 。 另 一 方面 ,我 们 可 以 计算 与 1= -4.38 相 联 系 的 P 值 。 这 个 概率 是 标准 正 态 
分 布 昨 部 的 面积 ,如 图 4 一 6 所 示 。 这 个 概率 值 非常 小 , 约 为 0.00001 或 0.001%。 也 就 是 
说 ,如 果 零 假设 B... =0 是 真 的 ,那么 得 到 一 个 和 我 们 实际 得 到 的 值 一 样 远离 零 假 设 的 局 
值 的 概率 极其 小 ,小 于 0. 001 免 。 由 于 这 个 事件 是 如 此 地 不 可 能 ,因此 有 理由 得 出 结论 : 零 
假设 是 假 的 。 

4.5.2 关于 Bi 的 单 边 假设 


到 目前 为 正 ,我们 讨论 的 重点 一 直 集 中 在 零 假 设 为 记 =B1o 和 备 择 假设 为 p. =p, WB 
设 检 验 。 这 是 一 种 双边 假设 检验 ,因为 在 备 择 假 设 下 ,B, 要 么 可 能 大 于 Bo, 要 人 么 可 能 小 于 
po。 但 是 ,有 时 用 单 边 假设 检验 是 比较 合适 的 。 例 如 ,在 学 生 一 教师 比 和 考试 成 绩 的 问题 

















SS] = Prya (4.21) 





中 ,许多 人 记 为 规模 较 小 的 班级 能 够 给 学 生 提供 一 个 更 好 的 学 习 环 境 。 在 此 假设 下 ,B, E 
负 的 ,表明 规模 较 小 的 班级 会 导致 较 高 的 成 绩 。 因 此 ,检验 零 假设 8, =0( 设 有 影响 ;和 单 边 
备 择 假设 B <0, 应 该 是 有 意义 的 。 
对 单 边 检验 而 言 , 零 假 设 和 单 边 备 择 假 设 是 : 
HB =f aH B <ñ FURAR) (4.23) 
其 中 ,Bio 是 在 零 假 设 下 B, 的 值 ( 在 学 生 一 教师 比 的 例子 中 为 0) , ñi S P Kit E B, 小 于 
B. as 如 果 备 择 假 设 是 局 AFA 。, 那 么 表达 式 (4 23) 中 不 等 式 要 改变 方向 。 


重要 概念 4.6 
零 假 设 Bñ, = 有 和 备 择 假设 有 = B, 的 检验 
1. tA Â, 的 标准 误 5( 记 ) (公式 (4.18) ) 。 
2. 计算 上 统计 量 (公式 (4.20))。 
3, 计算 p 值 (公式 (4.22))。 如 果 p 和 值 小 于 0.05 RAUA] >1.96, 那 么 在 5% 的 显著 


水 平 下 拒绝 零 假设 。 
检验 B =0 时 的 标准 误 ,特别 是 :统计 量 和 P 值 ,可 由 回归 软件 自动 计算 得 出 。 


AD 
-4.38 0 4.38 z 
PRE -4.38 左 
出 的 面积 与 +4.38 
右 侧 的 丰 积 之 和 


注 : 双 边 检 验 的 P 值 是 1Z1 > 11*“1 的 概率 ,其 中 Z 是 个 标准 正 态 随 机 变量 ,而 !* 是 根据 样本 所 计算 
的 1 统计 量 的 值 。 当 !*= -4 38 时 ,p 值 仅 为 0.00001。 
图 4 一 6 计算 当 属 = -4.38 时 洪 边 检验 的 p 值 
由 于 零 假 设 对 单 边 和 双边 假设 检验 都 是 相同 的 ,因此 ,t 统计 量 的 构造 也 是 相同 的 。 单 
边 和 双边 假设 检验 之 间 的 惟一 区 别 在 于 如 何 解释 : 统计 量 。 对 表达 式 (4, 23 ) 中 的 单 边 备 择 
假设 而 言 ,在 单 边 备 择 假设 下 ,+ 统计 量 很 大 的 负 值 {不 是 较 大 的 正 秆 ) 将 拒绝 零 假设 :如 果 
1“ < -1.645 ,那么 在 5 名 的 显著 水 平 下 拒绝 等 假 设 ,而 在 | 产 | >1.96 时 则 不 能 拒绝 堆 假 设 。 
由 累积 标准 正 态 分 布 可 获得 单 边 检验 的 p 值 , 即 : 
pf =P(Z<”)= (0) (p 值 , 单 边 左 尾 检验 ) (4.24) 
如 果 备 拌 候 设 是 B, >B o MAREA 23) 和 表达 式 (4 24) 中 的 不 等 式 要 改变 方向 ， 


RF p 值 是 右 尾 概 率 ,Pr( 2 >t). 
单 边 和 检验 在 什么 情况 下 使 用 ? 在 实际 应 用 中 ,只 有 当 具 备 清晰 的 理由 认为 B, 确实 是 在 








零 假 设 值 Bo 的 一 侧 时 , 才 应 该 使 用 单 边 备 择 假 设 。 这 个 理由 可 能 源 自 于 经 济 理论 .先前 的 
经 验证 据 或 二 者 的 结合 ,然而 ,即使 相应 的 备 择 假 设 在 最 初 好 父 是 单 边 的 ,但 实际 上 它 可 能 
并 不 一 定 如 此 。 比 如 对 于 一 种 新 研制 的 药品 来 说 ,由 于 先前 可 能 没 被 意识 到 的 某 种 副作用 ， 
在 实际 临床 试验 中 该 药品 被 证 实 是 有 害 的 。 在 班级 规模 的 例子 中 ,我 们 想起 这 样 一 个 关于 
大 学 毕业 生 的 笑话 , 据 传 一 所 大 学 成 功 的 秘密 在 于 招收 天 才 的 学 生 ,并 确保 教职员 工 远离 他 
们 , 尽 可 能 少 伤害 他 们 。 在 实际 中 ,这 种 模棱两可 性 经 常 使 得 经 济 计 量 学 家 采用 双边 检验 。 

媒 考 斌 成 绩 案 例 中 的 应 用 。 检验 班级 规模 对 考试 成 绩 没 有 影响 ( 即 表达 式 (4. 23) 中 的 
Bio =0) 这 一 假设 的 :统计 量 为 1* = -4.38。 它 小 于 -2 33(1 名 显著 性 水 平 下 单 边 检验 的 
临界 值 ) ,所 以 对 应 于 单 边 各 择 假设 的 鹤 假 设 在 1 多 的 显著 性 水 平 下 被 拒绝 。 事 实 上 ,P 值 小 
于 0.0006% 。 根 据 这 些 数 据 , 你 就 可 以 在 1%% 的 显著 水 平 下 拒绝 那 位 愤怒 的 纳税 人 的 断言 ， 
即 拒 绝 认为 斜率 的 负 估计 值 纯粹 是 由 于 随机 抽样 变化 所 引起 的 。 


4.5.3 ”检验 关于 截 踢 项 B, 的 假设 


前 面 的 讨论 一 直 集 中 在 检验 关于 斜率 B, 的 假设 上 ,然而 ,有 时 也 涉及 截 距 B 假设 的 检 

验 。 关 于 截 距 的 零 假设 和 双边 备 择 假设 是 : 
Hy Ba = B. EF, o Ao ol 双边 备 择 假设) (4.25) 

前 面 介绍 的 检验 零 假 设 的 三 个 步骤 也 同样 适用 于 记 的 检验 ( 见 重要 概念 4.6) (B, 的 标 
准 误 表 达 式 在 附录 4. 4 中 给 出 ) 。 如 果 条 择 假 设 是 单 边 的 ,那么 这 种 方法 要 进行 修正 ,就 像 
二 小 节 中 所 讨论 的 有 关 和 斜率 的 假设 检验 一 样 。 

如 果 你 心中 有 个 特定 的 零 假 设 ( 比 如 那 位 愤怒 的 纳税 人 ) ,那么 假设 检验 是 很 有 用 的 。 
在 统计 证 指 的 基础 上 接受 或 拒绝 这 个 零 假设 ,为 处 理 利用 样本 信息 了 解 总 体 特征 过 程 中 产 
生 的 不 确定 性 这 一 问题 提供 了 一 个 有 力 的 工具 。 然 而 ,很 多 的 时 候 关 于 回归 系数 的 单一 假 
设 没有 多 大 市 场 ,相反 ,人 们 更 想 要 知道 基于 数据 之 上 系数 取 值 的 菜 一 范围 。 这 样 就 要 求 我 
们 构造 置信 区 间 。 


[4.6_ 回归 系数 的 置信 区 间 - 


由 于 斜率 局 的 任何 统计 估计 值 必然 会 含有 抽样 不 确定 性 ,因此 根据 样本 数据 我 们 不 可 
能 精确 地 确定 有 的 真实 值 。 但 是 我 们 却 可 以 使 用 普 道 最 小 二 乘 估 计量 及 其 标准 误 来 构造 
斜率 及 RRE 8, 的 置信 区 间 。 

B. 的 置信 区 间 。 回 想 一 下 ,8 的 5%% 的 置信 区 间 有 两 个 等 价 的 定义 。 第 一 , 它 是 使 用 
双边 假设 检验 在 5 久 的 显著 性 水 平 下 不 能 被 拒绝 的 值 的 集合 。 第 二 , 它 是 一 个 以 95% 的 概 
ASA 的 真实 值 的 区 间 。 也 就 是 说 ,在 被 抽取 的 5 名 的 可 能 样本 中 ,置信 区 间 将 包含 A 
的 真实 值 。 因 为 这 个 置信 区 间 包 含 了 所 有 样本 中 95 免 的 样本 的 真实 值 ,所 以 它 被 称 为 具有 
95% 的 置信 水 平 。 

这 两 个 定义 等 价 的 原因 如 下 。 根 据 定 义 ,5 锡 的 显著 性 水 平 下 的 假设 检验 在 所 有 可 能 样 
本 中 只 有 5 马 的 机 会 拒绝 甩 的 真实 值 ,也 就 是 说 ,在 叹 % 的 所 有 可 能 样本 中 ,B, 的 真实 值 将 
不 会 被 拒绝 。 因 为 5% 的 置信 区 间 ( 如 第 一 个 定义 所 定义 的 ) 是 在 5 名 的 显著 性 水 平 下 不 
能 被 拒绝 的 B 的 所 有 值 的 集合 ,所 以 可 以 进一步 推论 ,在 所 有 可 能 的 样本 中 有 站 铝 的 机 会 
Ep 的 真实 值 被 包含 在 置信 区 间 里 。 











和 总 体 均值 置信 区 间 的 估计 一 样 ( 见 3. 3 节 ) ,原则 上 ,能 够 在 5% 的 显著 水 平 下 通过 使 
用 统计 量 检 验房 的 所 有 可 能 信 ( 即 对 所 有 的 房 , 值 ,检验 零 假 设 B, = Bi。) 计算 95% BJ E: 
信 区 间 。 那 么 ,9 名 的 置信 区 间 就 是 不 能 被 拒绝 的 所 有 p. 值 的 集合 ,但 对 所 有 的 p, 值 构造 
: 统计 量 将 会 很 费劲 。 

构造 曾 信 区 间 的 一 种 简单 方法 ,是 应 该 注意 到 只 要 p o MERMA + 5E( 记 ) 之 外 ,! 统 
计量 就 会 拒绝 假设 的 B16 值 。 也 就 是 说 ,8, 的 巡 锡 的 置信 区 间 就 是 区 间 ( 房 - 1.9638( 房 ) ， 
Êi +1.96SE( 色 ))。 这 一 方法 与 总 体 均值 置信 区 间 的 估计 方法 是 类 似 的 。 

Bi 的 壬 信和 区 间 的 构造 方法 性 结 在 重要 概念 4.7 中 给 出 。 

Bs 的 置信 区 问 。 B, 的 95 名 的 置信 区 间 的 构造 方法 与 重要 概念 4. 7 中 介绍 的 方法 一 样 ， 
不 过 需要 用 应 和 SE(A,) a 8, F SECR, )。 

在 考试 成 绩 案 例 中 的 应 用 。 公 式 (4.?) 所 给 出 的 考试 成 绩 对 学 生 一 教师 比 的 OLS 回归 
结果 是 :所 =698.7,B, = -2.28。 这 些 估 计 值 的 标准 误 为 SE(A,) =10.4,SE(A,) =0.52。 

由 于 标准 误 的 重要 性 ,今后 在 给 出 01S 回归 线 时 ,我 们 会 把 标准 误 包括 在 估计 系数 下 
面 的 括号 内 ; 


—— T 
TestScore = 698.9 - 2.28 xSTR (4.26) 
(10.4) (0.52) 


Bi B5 95% AROLE PCB] I -2.28 +1.96 x0.52}, 即 -3.30<B < - 1.26, 8, = 0 
的 值 并 不 包含 在 这 个 置信 区 间 内 ,因此 { 如 我 们 在 4.5 节 中 已 知道 的 ) ,B, =0 的 假设 在 5% 
的 显著 性 水 平 下 被 拒绝 。 


重要 概念 4.7 


B, 的 置信 区 间 
B, B 95% HRA 8 (ë PX BJ. 1 95% 的 概率 包含 p, 真实 值 的 区 间 , 也 就 是 说 , EE 
9s% 的 所 有 可 能 随机 抽取 的 样本 中 包 售 B, 的 真实 值 。 等 价 好 , 它 是 不 能 被 5% 的 双边 假设 
检验 拒绝 的 所 有 p, 的 值 的 集合 。 当 样本 容量 很 大 时 , 它 被 构造 为 : 
B, Bb 95% RERE = (ñ, - 1. 96SE(B.) Â, +1.968E(8,) ) (4.27) 
改变 所 导致 的 预测 效应 的 置信 区 间 。p, 的 好 % 的 置信 区 间 能 够 用 于 构造 的 普通 
变化 所 导致 的 预测 效应 的 95 人 的 置信 区 间 。 
考虑 按 一 个 给 定 的 量 Ax 改变 六。 与 X 的 这 个 变化 相 联 系 的 了 的 预测 变化 值 为 B.Ax。 
虽然 总 体 斜率 B, 是 未 知 的 ,但 是 因为 我 们 能 够 构造 8 的 置信 区 间 , 所 以 ,我 们 就 能 够 构造 
预测 效应 B. Ar 的 置信 区 间 。 由 于 局 的 95% 的 牌 信 区 间 一 端的 值 是 饭 -1.96SE( 房 ) , 因 
此 ,使 用 B, 的 该 估计 值 , 变 化 Ax 的 预测 效应 为 (BB -1.96SE( 房 )) x Ax。 置 信 区 间 另 一 端 
的 值 是 + 1.96SE(ñ,) ,使 用 该 估计 值 ,变化 后 的 预测 效应 为 [ (6, +1.96SE(A,)] x Ax. 
因此 ,以 一 定量 Az 改变 * 所 产生 的 效应 的 多 多 的 置信 区 间 能 被 表示 为 : 
B, As 的 95% 的 置信 区 间 = (Â, Ax - 1. 96SEC, ) Az, B, Ax + 1. 968E(Ü, ) Az) (4.28) 
例如 ,我 们 假想 的 那 位 教育 主管 正 考 虞 减少 学 生 一 教师 比 , 即 平均 每 名 教师 减少 2 名 学 
E. HFA 的 95 名 的 置信 区 间 是 ( -3.30, -1.26) ,因此 ,把 学 生 -- 教 师 比 减少 2 个 单位 
所 产生 的 效应 ,最 大 可 能 值 为 ( -3.30) x ( -2) =6. 隐 ,最 小 可 能 值 为 ( -1.26) x ( -2) = 








验 这 两 个 总 体 均值 相同 的 零 假设 和 对 应 的 备 择 假 设 , 等 同 于 检验 零 假设 B, = 0 和 双边 备 择 
假设 B, 关 0。 这 个 假设 能 够 用 4.5 节 中 所 列 出 的 程序 进行 检验 。 具 体 来 说 , 当 OLS 的 :统计 
量 的 值 = 房 /SBE( 房 ) 的 绝对 值 超过 1. 96 时 ,对 应 于 双边 检验 备 择 假设 的 零 假 设 在 5 名 的 显 
著 性 水 平 下 被 拒绝 。 同 理 ,如 4.6 节 中 所 描述 的 ,8 的 95 名 的 置信 区 间 即 雇 二 1. 96SE(A,.) ， 
为 两 个 总 体 均值 的 差 提 供 了 一 个 95% HAKE 

在 考试 成 绩 案 例 中 的 应 用 “作为 一 个 例子 ,利用 图 4 一 2 中 的 420 个 观测 值 ,使 用 0LS 
法 估计 考试 成 绩 对 定义 在 (4. 29) 中 的 学 生 一 教师 比 二 元 变量 D 进行 回归 ,结果 为 : 

Fason = 650.0 ~ 7.4D (4.33) 
(13) (1.85 

其 中 ,系数 B, ME, BJ OLS 估计 值 的 标准 误 在 OLS 估计 和 值 下 面 的 揪 导 内 给 出 。 因 此 ,学 生 一 
教师 比 大 于 或 等 于 20( 即 D =0) 的 子 样本 的 平均 考试 成 绩 是 650.0 ,而 学 生 一 教师 比 小 于 
20{ 即 D=1) 的 子 样本 的 平均 考试 成 绩 是 650,0 + 7.4 =657.4。 因 而 ,这 两 组 样本 平均 考试 
成 绩 之 差 是 7.4。 这 就 是 学 生 一 教师 比 二 元 变量 也 的 系数 局 的 OLS 估计 值 。 

这 两 个 组 的 总 体 平均 考试 成 绩 之 善 统 计 上 在 5 的 显著 性 水 平 下 是 否 显著 地 异 于 03? 
为 了 得 出 结果 ,构造 关于 B, 的 :统计 量 ,: =7.471.8 =4.04。 它 在 绝对 值 上 大 于 1,%6, 所 以 
在 5 多 的 显著 性 水 平 下 ,我 们 拭 绝 学 生 一 教师 比 高 的 地 区 与 学 生 一 教师 比 低 的 地 区 总 体 平 
均 考 试 成 绩 相 同 " 这 一 零 假 设 。 

OLS 佑 计量 及 其 标准 误 可 用 来 构造 均值 真实 差异 的 %5 免 的 置信 区 间 。 这 个 置信 区 间 
是 :7.4+1.96 x1.8=(3.9,10.9)。 这 个 置信 区 间 不 包括 B =0, 所 以 (根据 上 一 段 我们 所 
知道 的 ) 我 们 在 5% 的 显著 性 水 平 下 拒绝 p =0 这 一 假设 。 








R° 和 回归 的 标准 误 是 评价 OLS 回归 线 对 数据 拟 合 程度 好 坏 的 两 个 测度 指标 。RR 的 什 
在 0 和 1 之 间 变 化 , 它 测度 了 卫 的 方差 中 由 艺 的 变化 所 解释 的 部 分 。 回 归 标 准 误 则 直观 地 
测度 了 Y 距离 它 的 预测 值 有 多 远 。 


4.8.1 R 


同 归 的 R° (regression R ERE Y, 的 样本 方差 中 由 元 所 解释 (或 预测 ) 的 部 分 。 预 测 


值 和 残 差 的 定义 { 见 重要 概念 4. 2) 允许 我 们 将 因 变 量 了 表示 为 预测 值 多 加 上 残 差 z, 
之 和 : 
Y =F. +ú, (4.34) 
在 这 个 符号 表示 中 , 民 R Y 的 样本 方差 与 了 的 样本 方差 之 比 。 
在 数学 上 , R° 可 被 表示 为 被 解释 的 平方 和 与 总 平方 和 之 比 。 被 解释 的 平方 和 
[ explained sum of squares} 或 ESS, 等 于 了 HAWE Í, 与 其 均值 的 离 差 平方 和 ;总 平方 
和 [total sum of squares) 或 TSS, 等 于 站 与 其 均值 的 离 差 平方 和 , 即 : 


ESS = > (k, -FY (4.35) 


TSS = yu, -FF (4.36) 





其 中 ,公式 (4. 35) 使 用 了 了 等 于 样本 均值 的 OLS 预测 信 这 一 事实 (证 明 见 附录 4 3) 。 
R: 是 被 解释 的 平方 和 与 总 平方 和 之 比 , 即 ， 


2 
R TSS 


HERDE, R 也 可 表示 为 了 的 方差 中 不 能 由 X, 所 解释 的 那 部 分 方差 的 比重 。 
RAH (sum of squares residuais) 或 SSR, 等 于 OLS 残 差 平方 和 ,出 : 


(4.37) 


SSR = y (4.38) 
在 附录 4. 3 中 证 明了 TSS = ESS + SSR, AERE 也 能 被 表示 为 1 减 去 残 差 平方 和 与 总 平方 
和 之 比 , 即 : 

m =1 -SR (4.39) 


RSS 

最 后 ,了 对 单个 回归 因子 于 回归 的 到 是 了 和 二 之 间 相 关系 数 的 平方 。 

E 的 取信 范围 在 0 和 1 之 间 。 如 果 记 =0, 那 么 X 没有 解释 Y. 的 方差 ,而 基于 回归 的 
Y, 的 预测 值 恰 好 是 了 的 样本 均值 。 在 这 种 情况 下 ,被 解释 的 平方 和 为 0, 残 差 平方 和 等 于 
总 平方 和 ,因而 , 尼 为 0。 相 反 ,如 果 大 解释 了 了 ,的 所 有 变化 ,那么 对 于 所 有 的 i 有 了 =P, 
每 个 残 差 都 为 0{ 即 u =0) ,这 样 ,就 有 ESS = TSS H R =1。 一 般 地 说 ,下 不 会 取 0 或 1 这 
BARA MER CEZAREA. P 接近 于 1 ,表明 回归 因子 预测 Y. 的 效果 很 好 ,而 严 
接近 于 0, 表 明 回 归 因 子 预测 了 的 效果 很 差 。 


4.8.2 回归 的 标准 误 
回归 的 标准 误 { standard error of the regression) 或 SER 是 回归 误差 & 的 标准 差 的 个 
计量 。 由 于 回归 误差 u,e, 是 观察 不 到 的 ,因此 ,用 对 应 的 样本 残 差 即 0LS RÆ h,o, 
u, 来 计算 SER, SER 的 计算 公式 如 下 ， 
SER = sa 其 中 心心 = Dp =- (4.40) 


这 里 ,s 的 表达 式 用 到 了 OS 残 差 的 样本 均值 为 零 这 个 事实 (证 明 见 附录 .3)。 

除了 公式 (3.7) 中 的 Y -Yai 所 代 蔡 ,公式 (3.7) 中 的 除数 是 -1 而 这 里 的 除数 是 
n ~2 以 外 ,公式 (4. 40) 中 SER 的 表达 式 和 3.2 节 里 公式 (3.7) 中 所 给 出 的 Y 的 样本 标准 差 
的 表达 式 是 相同 的 。 这 里 除数 用 n -2( 代 准 =) 的 原因 与 公式 {3.7) 中 的 除数 用 =- 1 的 原 
因 一 样 : 它 修正 了 由 估计 两 个 回归 系数 所 引起 的 微小 的 向 下 偏差 , 这 被 称 为 自由 度 " 修正; 
由 于 要 估计 两 个 系数 (8, 和 8B1) ,因此 损失 了 数据 的 两 个 自由 度 , 这 样 这 个 因子 中 的 除数 就 
Jen -2( 其 背后 的 数学 意义 在 15.4 节 中 讨论 ) 。 当 = 很 大 时 , 除 以 nn -1 或 n-2 的 差别 
是 可 以 忽略 的 。 


-4.9_ 异 方差 性 和 同方 差 性 


RTA X, 为 条 件 的 上 的 分 布 ,我 们 只 假设 它 具 有 零 均 值 { 第 一 个 最 小 二 乘 假设 )。 此 
外 ,如 果 这 个 条 件 分 布 的 方差 不 依赖 于 X,, 那 么 就 称 误差 项 是 同方 差 的 。 本 节 讨 论 了 同方 
差 性 及 其 理论 含义 ,在 误差 是 同方 差 条 件 下 OLS 估计 基 的 标准 误 的 简化 表达 式 , 以 及 在 实 
际 中 使 用 这 些 简 化 表达 式 所 面临 的 风险 。 














P. 


4.9.1 什么 是 异 方差 和 同方 差 


异 方 甘 和 问 方 差 的 定义 。 如 果 给 定 天 ,对 于 任何 的 i=1,n,w, 的 条 件 分 布 的 方差 为 常 
数 ,尤其 是 它 不 依赖 于 ,那么 就 称 误差 项 ,是 向 方差 的 {homoskedastic) ;否则 ,误差 项 
就 是 异 方 差 的 {heteroskedastic)】， 

作为 一 个 例子 ,我 们 加 到 图 4 一 4。 图 4 一 4 给 出 了 误差 项 在 不 同 x 值 条 件 下 的 分 布 。 
由 于 这 个 分 布 适用 于 特别 指定 的 x* 值 ,因此 ,这 就 是 在 给 定式 =x 3 F u, 的 条 件 分 布 。 正 
如 该 图 所 描述 的 ,所 有 这 些 条 件 分 布 都 具有 相同 的 离散 度 ,更 精确 地 说 ,对 于 不 同 的 * 值 ,这 
些 分 布 的 方差 都 是 相同 的 。 也 就 是 说 ,在 图 4 一 4 中 ,给 定 站 =x,u, 的 条 件 方差 不 依赖 于 x 
的 变化 而 变化 ,所 以 图 4 一 4 中 所 说 明 的 误差 是 同方 差 的 。 

相反 ,图 4 一 ?7 列 示 了 u, 的 条 件 分 布 随 着 x 的 增加 而 向 外 扩散 的 一 种 情况 。 对 于 较 小 
的 x 值 , 这 个 分 布 是 密集 的 ,但 对 于 较 大 的 x 值 , 它 具 有 更 大 的 离散 度 。 因 此 在 图 4 一 7” 中 ， 
PE X =x 条件 下 ,uw 的 方差 随 着 x 的 增加 而 增 大 ,这样 图 4 一 ? 中 的 误差 就 是 异 方差 的 。 


考试 成 绩 
720 
u X=158#l 的 分 布 
700 X=20 时 了 的 分 布 
/ 当 X=20 时 了 的 分 Y x-25 时 了 的 分 布 
680 / 
660 / 
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30 
学 生 一 教师 比 
注 : 像 图 4 一 4 一 样 ,这 个 图 显示 了 三 个 不 同 规模 班级 的 考试 成 绩 的 条 件 分 布 。 和 图 4 一 4 不 一 样 的 
是 ,对 较 大 的 班级 规模 而 言 . 这 些 分 布 更 加 向 外 扩展 { 具有 较 大 的 方差 )。 由 于 给 定 X, u 的 分 布 的 方差 
var(xx 妇 依赖 于 站 ,因此 口 是 异 方差 的 。 
图 4--7 异 方 问 的 一 个 例子 
有 异 方差 和 局 方差 的 定义 总 结 在 重要 概念 4 8 中 给 出 。 


重要 概念 4.8 
. 23 ny e 
HFE i=1,-- n, MRE X, KEEF u, 的 条 件 分 布 的 方差 var( u IX, =x) 都 是 常 
数 ,尤其 是 它 不 依赖 于 x 的 变化 而 变化 ,那么 就 称 误差 项 u, 是 同方 差 的 ;否则 ,误差 项 就 是 
异 方差 的 。 


例子 。 这 两 个 术语 的 构 词 是 很 长 的 ,而 且 这 个 定义 可 能 很 抽象 。 为 了 用 一 个 例子 阐明 
这 两 个 术语 ,我 们 离开 一 下 学 生 一 教师 比 与 考试 成 绩 的 问题 ,而 回 到 3. 5 节 中 所 考虑 的 男女 
大 学 毕业 生 收 入 的 例子 中 。 设 MALE, 是 个 二 元 变量 ,对 男 大 学 生 而 言 , 它 等 于 1 ,而 对 女 大 
学 生 而 言 , 它 等 于 0。 对 i=1,…,n, 联 系 某 人 的 收入 及 其 性 别 的 二 元 变量 回归 模型 为 : 


Enrnings, = Ë, +B, MALE, +u, (4.41) 








误差 项 是 同方 差 的 ,那么 存在 一 个 专门 的 公式 用 于 计算 名 f ñ, 的 标准 误 ,这些 公 式 在 呐 录 
4.4 中 给 出 。 在 工 是 二 元 变量 这 一 特殊 情况 下 ,在 同方 差 下 ñ, 的 方差 佑 计量 ( 即 在 同方 差 
T ñ, 的 标准 误 的 平方 ) 就 是 在 3.4 节 的 脚注 全 中 讨论 的 所 谓 的 均值 差异 的 混合 方差 公式 
{ pooled variance formula) a 

由 于 这 些 可 供 选 祥 的 公式 都 是 在 误差 项 是 同方 差 的 特定 情况 下 推导 得 出 的 ,并 不 适用 
于 澡 差 项 是 异 方差 的 情况 ,所 以 它们 被 称 为 OS 佑 计量 的 方差 和 标准 误 的 “人 奴 通 用 于 同方 
差 的 "公式 。 正 像 这 个 名 称 所 瞳 示 的 ,如 果 误 差 项 是 异 方差 的 ,那么 这 个 仅 适 用 于 同方 差 的 
标准 误 {hornoskedasticity -only stardard errors) 就 是 不 适当 的 。 特 别 是 说 ,如 果 误 差 项 是 
界 方差 的 ,那么 使 用 仅 适 用 于 同方 差 的 标准 误 计 算 的 ! 统计 量 不 服从 标准 正 态 分 布 ,即使 在 
大 样本 条 件 下 也 是 如 此 。 事 实 上 ,用 于 这 个 仅 适 用 于 同方 差 的 :统计 量 的 正确 的 临界 值 取 
雇 于 这 个 异 旋 差 的 确切 性 质 ,所 以 这 些 临 界 值 不 能 被 列表 给 出 。 同 理 , 如 果 误 差 项 是 异 方差 
的 ,但 置信 区 间 被 构造 为 +1. 9% 倍 的 仅 适用 于 同方 差 的 标准 误 ,那么 一 般 而 言 ,这 个 区 间 包 
会 系数 真实 值 的 概率 不 是 95 够 ,即使 在 大 样本 条 件 下 也 是 如 此 。 

相反 ,由 于 间 方 差 是 异 方差 的 一 个 特例 ,因此 ,不 论 误 差 项 是 异 方差 的 还 是 同方 差 的 , 公 
式 (4. 19) 和 公式 (4. 59) 中 给 出 的 启 # ñ, 的 方差 估计 量 ch 和 Ga? 会 产生 有 效 的 统计 推 
断 。 因 此 不 论 误差 项 是 否 是 异 方差 的 ,基于 这 些 标准 误 的 假设 检验 和 置信 区 间 都 是 有 效 的 。 
因为 不 论 误差 项 是 否 是 异 方差 的 ,到 目前 为 止 ,我 们 所 使 用 的 标准 误 ( 妈 基 于 公式 (4. 19) 和 
公式 (4. 59) 的 那些 标准 误 ?都 会 导致 让 效 的 统计 推断 ,所 以 它们 被 称 为 异 方差 稳健 的 标准 
误 {heteroskedasticity - robust standard errors) 。 因 为 这 些 公 式 是 由 Eieker( 1967) , Huber 
(1967) 和 White( 1980) 提出 来 的 ,所 以 它们 也 被 称 为 Eicker — Huber - White 标准 误 。 


4.9.3 异 方 差 和 同方 差 在 实际 中 意味 着 什么 


就 异 方 莽 和 同 太 盖 来 说 , 娜 一 个 更 符合 实际 ? 回答 这 个 问题 取决 于 实际 应 用 情况 。 不 
过 ,我 们 可 以 回 到 不 同性 别 的 大 学 毕业 生 收 入 差距 这 个 例子 ,用 这 个 例子 来 诊 明 这 个 问题 。 
至 于 哪 一 个 假设 更 敏感 ,我 们 可 以 看 一 看 周转 现实 世界 里 人 人 们 的 工资 怎样 被 支付 ,这 可 能 会 
给 我 们 提供 一 些 思考 的 线索 。 许 多 年 以 来 ,我 们 很 少 会 发 现在 一 流 报 柄 水平 的 工作 中 有 女 
性 :总 是 有 报酬 很 低 的 男性 ,但 几乎 没有 报酬 很 高 的 女性 。 这 说 明 女 性 收入 的 分 布 要 比 男 性 
收入 的 分 布 更 紧凑 。 换 句 话 说 ,公式 {4. 42) 中 女性 的 误差 项 的 方差 ,似乎 合理 地 低 于 公式 
(4.43) 中 男性 的 误差 项 的 方差 。 因 此 ,女性 的 工作 和 工资 水 平 的 这 种 "封顶 现象 "的 存在 ， 
未明 了 公式 (4. 41) 中 二 元 变量 回归 模型 的 误差 项 是 异 方 差 的 。 除 非 存 在 无 法 抗拒 的 相反 
的 原因 { 我 们 认为 不 会 存在 这 些 原因 ) ,否则 ,在 这 个 例子 中 ,把 误差 项 作为 异 方 差 来 处 理 是 
很 有 意义 的 。 

上 述 这 个 对 收入 建 模 的 例子 表明 , 异 方 差 在 许多 经 济 计量 应 用 中 都 会 出 现 。 在 一 般 情 
WF ,经济 理论 很 少 会 给 出 任何 原因 让 人 相信 误差 项 是 赣 方 盖 的 。 因 此 ,对 误差 项 做 出 异 广 
差 的 很 设 ,这 一 做 法 是 审慎 的 ,除非 你 有 无 法 拒绝 的 理由 确信 误差 项 是 同方 车 的 。 

实际 意义。 这 个 讨论 给 我 们 引出 的 核心 问题 是 ,在 实际 中 我 们 是 应 该 使 用 异 方差 稳健 
的 标准 误 还 是 使 用 仅 适 用 于 同方 差 的 标准 误 ? 在 这 个 问题 上 ,想象 一 下 ,我 们 两 个 都 计算 ， 
热 后 在 它们 之 间 进 行 选择 ,这 是 一 种 有 用 的 橄 法 。 如 果 仅 适用 于 同方 差 的 标准 误 和 蜡 方差 
稳健 的 标准 误 是 相同 的 ,那么 使 用 异 方差 稳健 的 标准 误 不 会 有 性 何 损失 ;但 如 果 它 们 不 同 ， 
那么 你 就 应 该 使 用 更 可 靠 的 即 考虑 到 异 方差 的 那 一 个 。 最 简单 的 做 法 就 是 总 是 使 用 异 方差 











稳健 的 标准 误 。 

由 于 历史 原因 ,许多 软件 程序 都 用 仅 适 用 于 同方 差 的 标准 误 作为 默认 设置 ,因此 是 否 使 
用 红 方 差 稳健 的 标准 误 这 个 选项 ,需要 由 使 用 者 自己 决定 。 如 何 去 执 行 异 方差 稳健 的 标准 
误 的 计算 细节 ,取决 于 你 所 使 用 的 软件 包 。 

在 本 书 的 所 有 经 验 例子 中 ,除非 有 明确 说 明 ,否则 我 们 都 使 用 异 方差 稳健 的 标准 误 中 。 


现在 回 到 本 章 开 头 所 提 到 的 问题 中 ,教育 主管 正 考 虑 雇佣 更 多 的 教师 来 前 减 学生 一 教 
师 比 。 到 现在 为 止 ,我 们 学 到 了 什么 知识 而 且 对 她 可 能 是 有 用 的 ? 

根据 1998 年 加 利 福 尼 亚 州 的 考试 成 绩 数据 集中 的 420 个 观测 值 ,我 们 的 回归 分 析 表 
明 , 在 学 生 一 教师 比 和 考试 成 绩 之 间 存 在 负 向 的 关系 , 即 班 级 规模 较 小 的 地 区 会 有 较 高 的 考 
试 成 绩 。 从 实际 意义 上 说 ,回归 系数 是 比较 大 的 :平均 来 看 ,学 生 一 教师 比 每 减少 2 个 单位 ， 
其 考试 成 绩 平均 就 会 高 出 4 6 分。 这 相应 地 把 该 地 区 从 考试 成 绩 分 布 的 第 50 个 百 分 位 数 
的 位 置 ,二 移 到 大 约 第 60 个 百 分 位 数 的 位 置 。 

学 生 一 教师 比 这 一 回归 系数 统计 上 在 5% 的 显著 性 水 平 下 显著 地 和 异 于 0。 总 体系 数 可 
能 是 0, 我 们 可 能 只 用 了 一 个 随机 的 样本 估计 出 了 这 个 负 的 系数 。 然 而 ,在 基 余 的 潜在 的 随 
机 样本 中 通过 纯粹 随机 抽样 的 方法 估计 出 总 体系 数 是 (以 及 获得 一 个 和 我 们 所 得 到 的 一 
样 大 的 p, 的 :统计 量 ) 的 概率 极其 小 , 约 为 0.001%。pBi 的 5 名 的 置信 区 间 是 -3.30< B, 
~-1.26, 

对 于 回答 教育 主管 的 问题 ,我 们 已 取得 了 相当 大 的 进展 。 然 而 ,恼人 的 问题 仍然 存在 。 
虽然 我 们 估计 了 学 生 一 教师 比 和 考试 成 绩 之 间 的 负 向 关系 ,但 是 这 种 关系 是 否 一 定 是 教育 
主管 进行 决策 所 需要 的 那个 因果 关系 呢 ? 我 们 已 发 现 平 均 来 看 ,学 生 一 教师 比较 低 的 地 区 
具有 较 高 的 考试 成 绩 ,但 这 是 否 意味 着 降低 学 生 一 教师 比 确实 能 够 提高 成 绩 呢 ? 

事实 上 ,人 们 有 理由 担心 降低 学 生 一 教师 比 可 能 不 是 提高 学 生成 绩 的 原因 。 毕 竞 雇 全 
更 多 的 教师 需要 花费 资金 ,所 以 比较 富裕 的 学 区 能 够 更 好 地 负担 得 起 较 小 的 班级 规模 。 但 
比较 富裕 的 学 校 的 学 生还 在 其 他 方 而 优 于 较 穷 的 邻 校 学 生 ,包括 较 好 的 设备 , 较 新 的 课本 和 
薪水 较 高 的 教师 。 另 外 ,这 些 学 校 里 的 学 生 本 身 倾向 于 来 自 更 富裕 的 家 庭 , 从 而 拥有 与 他 们 
的 学 校 没有 直接 关系 的 其 他 优势 。 例 如 ,加 利 福 尼 亚 州 有 一 个 大 规模 的 移民 社区 ,这 些 移 民 
一 般 比 总 体 上 的 居民 穷 。 在 许多 情况 下 ,他们 孩子 的 母语 也 不 是 英语 。 这 样 , 在 学 生 一 教师 
比 和 考试 成 绩 之 冶 我 们 所 估计 出 的 负 向 关系 ,可 能 是 由 我 们 所 发 现 的 小 班 型 连同 许多 其 他 
因素 一 起 作用 的 结果 ,而 实际 上 这 些 其 他 因素 可 能 是 降低 考试 成 绩 的 真正 原因 。 

这 些 其 他 因素 或 “遗漏 变量 " 可 能 意味 着 ,迄今 为 止 我 们 所 做 的 OLS 分 析 实 际 上 对 教育 
主管 几乎 没有 价值 。 事 实 上 它 可 能 会 造成 误导 :只 改变 学 生 一 教师 比 ,而 不 改变 那些 真正 决 
定 孩 子 在 校 成 绩 的 其 他 因素 。 为 了 解决 这 个 问题 ,我 们 需要 一 种 在 保持 那些 其 他 因素 不 变 
的 情况 下 ,允许 我 们 将 改变 学 生 一 教师 比 对 考试 成 绩 的 影响 分 高 出 来 的 方法 。 这 种 方法 就 
是 多 元 回归 分 析 , 这 是 第 5 章 的 主题 。 








中 ”如 果 梅 本 书 和 其 他 课本 一 起 使 用 ,请 注意 ,一 些 课本 把 同方 若 如 入 到 最 小 二 桨 般 设 中 。 操 而 ,正如 此 处 所 讨论 
的 ,对 OLS 分 析 的 月 效 性 而 言 ,这 个 扰 外 的 假设 不 是 必须 的 ,只 要 我 们 使 用 了 措 方 差 稳健 的 标准 误 。 


总 结 





1. 总 体 回 归 线 8, +B,X 是 了 的 均值 ( 它 是 了 值 的 函数 )。 斜率 PB, 是 与 了 的 一 个 单位 变 
化 相 联 系 的 了 的 期 望 变 化 。 截 距 项 G, 决定 回归 线 的 水 平 (或 高 度 )， 重 要 概念 4. 1 中 总 结 
了 总 体 线性 回归 模型 的 术语 。 

2. 总 体 回归 线 可 以 采用 普通 最 小 二 乘法 (OLS) ,利用 样本 观测 值 (X,Y.) (i=1,…,n) 
进行 估计 。 回 归 直 线 的 截 忠和 和 斜率 的 OLS 估计 量 分 别 表示 为 B MÊ, 

3. 线性 回归 模型 有 三 个 重要 的 假设 ;(1) 同 归 误 差 项 & 以 回归 因 学 为 条 件 的 条 件 均 
值 为 零 ;(2) 样 本 观测 值 是 独立 同 分 布 的 从 总 体 中 随机 抽取 的 样本 ;(3) 随 机 变量 具有 四 阶 
矩 。 如 果 这 些 很 设 成 立 ,那么 OLS 估计 量 启 f ñ, 是 :{1) 无 偏 的 ;(2) 一 致 的 ;(3) 当 样本 很 
大 时 ,服从 正 态 分 布 。 

4. 回归 系数 的 假设 检验 类 似 于 总 体 均 值 的 假设 检验 :使 用 :统计 上 共计 算 p 值 ,然后 决定 
是 接受 还 是 拒绝 零 假 设 。 和 总 体 均 值 的 置信 区 间 估 计 方 法 一 样 ,回归 系数 的 5 名 的 置信 区 
间 是 估计 量 +1. 96 倍 标准 误 。 

5. 当 是 二 元 变量 时 ,而 归 模 型 可 被 用 来 估计 和 检验 关于 "X=0" 组 和 “X=1" 组 总 体 
均值 之 差 的 假设 。 

6. R°: 和 回归 标准 误 (SER) 是 测度 Y, 的 值 与 所 估计 的 回归 直线 之 间 紧 蜜 程度 的 指标 。 
R 的 取信 在 0 和 1 之 间 , 较 大 的 值 表明 Y, 的 值 更 接近 于 回归 直线 。 同 归 标 准 误 是 回归 误差 
项 的 标准 差 的 一 个 估计 量 。 

7. 通常 ,误差 项 w 是 异 方差 的 ,也 就 是 说 ,给 定 的 值 ,u DAE var( u, 1X, = 了 依赖 
Frs 一 个 特殊 的 情况 是 ,误差 项 是 同方 差 的 , 即 varle IX, =x) 为 常数 。 当 误差 项 是 异 方差 
的 时 , 仅 适 用 于 同方 差 的 标准 误 不 会 产生 有 效 的 统计 推断 ,但 是 异 方差 稳健 的 标准 误 却 会 产 
生 有 效 的 统计 推断 。 








重要 术语 - 


一 元 线性 回归 模型 ” 因 变 量 自 变量 回归 因子 ”总体 截 距 和 斜率 ”总体 回归 线 总 
体系 数 “ 总 体 回归 函数 “参数 ”误差 项 “普通 最 小 二 乘 (0LS) 估 计量 ”01LS 回归 线 预测 
E Ra 最 小 二 乘 假设 “ 房 的 标准 误 :统计 量 p ,的 置信 多 间 置信 水 平 të 
示 变量 虚拟 变量 乘 以 变量 D, HRA D 的 系数 ”回归 的 尼 ”被 解释 的 半 方 和 (ESS) 

总 平方 和 ( 7T35) ” 残 差 平方 和 (3SR) 回归 标准 误 (SER) ” 异 方 差 和 同方 差 最 佳 线性 
无 偏 估计 量 (BLUE) ”加 权 最 小 二 乘 ” 仅 适用 于 同方 差 的 标准 误 、 异 方差 稳健 的 标准 误 


[复习 概念 ] 


4.1 解释 说 明 记 5 B, ZANKI RA i, 与 回归 误差 ú, 之 间 的 区 别 ;0LS 预测 值 了 
和 ECY.1X,) 之 间 了 的 区 别 。 

4.2 简 述 利用 独立 同 分 布 的 (i=1,…,n) 的 观测 值 集合 ,计算 双边 检验 且 :poy =0 的 
p 值 的 过 程 。 简 述 在 回归 模型 中 利用 独立 同 分 布 的 观测 值 集合 (工艺 ) (i=1,…,n) ,计算 





双边 检验 H: =0 的 p 值 的 过 程 。 

43 解释 说 明 如 何 利用 3, 5 节 中 的 数据 ,用 回归 模型 来 估计 工资 的 性 别 差 异 。 因 变 基 
和 自 变 其 分 别 是 什么 ? 

4.4 分 别 夯 出 所 司 计 的 回归 方程 其 拟人 台 优 庆 分 别 为 正 =0.9 和 玉 =0. 5 的 假想 的 同 
归 数 据 的 散 点 图 。 


[练习 1 


标 有 "的 习题 解 管 可 在 本 书 的 网 址 www. aw. eony stock _ watson 上 找到 。 
"4. 1 假设 研究 人 员 利 用 来 自 100 个 三 年 级 的 班级 的 数据 ,研究 了 关于 班级 规模 (CS) 
和 平均 考试 成 绩 之 间 的 关系 ,估计 了 OLS 回归 方程 : 


= 
TestScore = 520.4 — 5.82 x CS,R' =0.08,SER = 11.5 
(20.4) (2.21) 


a 一 个 班 皮 22 个 学 生 , 这 个 班 平均 考试 成 绩 的 回归 预 侧 值 是 多 少 ? 

b. 某 班 去 年 有 19 个 学 生 , 而 今年 有 23 个 学 生 ,这 个 班 平均 考试 成 绩 变化 的 回归 预测 
值 是 多 少 ? 

c 构造 回归 斜率 系数 记 的 5 名 的 置信 区 间 。 

d. 计算 零 假 设 HB =0 的 双边 检验 的 p 值 。 在 5% 的 显著 性 水 乎 下 是 否 拒 绝 零 假设 ? 
在 1% 的 显著 性 水 平 下 呢 ? 

e. # 100 个 班级 之 间 的 样本 平均 班级 规模 为 21. 4, 这 100 个 班级 之 间 的 考试 成 绩 的 样 
本 均值 是 多 少 ? (提示 :复习 0LS 估计 量 公 式 ) 

f. 这 100 个 班级 考试 成 绩 的 样本 标准 差 是 多 少 ? (提示 :复习 R 和 SER 的 计算 公式 ) 

4.2 假设 一 位 研究 人 员 使 用 随机 选择 的 250 个 男 工 人 和 280 个 女工 人 的 工资 数据 , 估 
计 出 OLS 回归 方程 妨 下 : 


= 
Wage = 12.68 + 2.79 Male,R°=0.06,SER =3.10 
(0.18) (0.84) 

其 中 ,age 用 美元 /小 时 测度 ;Male 是 个 二 元 变量 ,如 果 是 男 工人 ,那么 Mak = 上 ,如果 是 女 
工人 ,那么 Male =0。 定 义工 次 的 性 别 差 路 为 男女 平均 收 人 之 差 。 

a. 所 估计 的 (工资 的 ) 性 别 差 距 是 多 少 ? 

hb， 所 估计 的 (工资 的 ) 性 别 差 座 是 否 姑 著 地 蜡 于 0( 计 算 检验 零 假设 “不 存在 性 别 差 距 ” 
时 所 用 的 p 信 )? 

e. 构造 这 个 (工资 的 ) 性 别 差 距 的 站 锡 的 置信 区 间 。 

d. 在 这 个 样本 中 ,女性 的 平均 工资 是 多 少 ? 男性 的 平均 工资 是 多 少 ? 

e.， 另 一 位 研究 人 员 使 用 网 样 的 数据 ,但 是 用 Wage 对 Female 进行 回归 ,如 果 是 女工 人 ， 
则 Female =13; 如 果 是 男 工人 , 则 Female =0。 由 这 个 回归 所 计算 的 回归 估计 值 是 多 少 ? 


— 
Wage = + Female R = ,SER = 











*4.3 证 明 : 第 一 个 最 小 二 乘 假设 下 (zu X) =0 隐 合 E(Y IX.) =ñ, +B.X., 

4.4 证 明 :局 是 的 无 篇 估计 量 。({ 提示 :利用 应 是 无 坊 的 事实 ,证 明 见 附录 4.3) 

45 假设 从 总 体 中 选择 了 200 个 20 岁 男 性 的 随机 样本 ,并 记录 了 他 们 的 身高 和 体重 。 
体重 对 身高 的 回归 方程 为 





— 
Weight = —99 41 + 3.94 Height, R° =Ü. B] , SER = 10. 2 
(2.15) (0.31) 


其 中 ,Weight HERNE ,Heght Maeti gE. 

a 对 -个 身高 为 70 AA ñ 8 EAE MES 身高 为 名 英寸 和 74 英 
才 的 人 的 体重 呢 ? 

b -个 人 发 育 较 晚 ,并 在 一 年 内 长 高 了 1.5 英寸 。 这 个 人 的 体重 增加 量 的 回 好 预测 值 
是 多 少 ? 

c 构造 (5) 中 体重 增 基 的 99 免 的 置信 区 间 。 

d. 假设 分 别 用 千克 和 厘米 来 测度 身高 和 体重 ,而 不 用 磅 和 和 英寸 ,根据 这 个 新 的 千克 一 
厘米 数据 回归, 回归 估计 值 是 多 少 (给 出 所 有 的 结果 .估计 系数 .标准 误 .六 和 SER)? 

4.6 从 公式 (4 15) 出 发 ,推导 出 在 附录 4.4 中 公式 (4.61》 所 给 出 的 同方 差 条 件 下 应 T po 
的 方差 。 T 


[附录 4. 1 加利福尼亚 州 考 试 成 绩 数 据 集 - 


加 利 福 尼 亚 州 标准 化 考试 及 报告 的 数据 集 包 括 考 试 成 绩 、. 学 校 特 征 和 学 生 的 人 口 统 计 
背景 的 数据 。 这 里 所 用 的 数据 取 自 于 所 有 在 1998 年 和 1999 年 可 获得 数据 的 加 利 福 尼 亚 州 
的 420 个 K-6 和 KK-8 地 区 。 考 试 成 绩 是 斯 坦 福 9 类 达标 考试 (the Stanford 9 Achievement 
Test) ( 个 对 无 年 级 学 生 进 行 的 标准 化 考试 ) 中 关于 阅读 和 数学 成 绩 的 平均 数 。 学 校 特征 
(地 区 疗 的 平均 ) 包 括 注 册 人 数 .教师 的 数量 (用 "全 职 教师 等 同 量 折合 ”) ,每 间 教 室 的 计算 
机 数量 和 每 个 学 生 的 费用 支出 。 这 里 所 用 的 学 生 一 教师 比 是 该 地 区 的 全 职 教师 等 同 量 人 数 
除 以 学 生 人 数 。 学 生 的 人 口 统计 变量 也 是 在 地 区 间 进 行 平 均 的 。 学 生 的 人 口 统 计 变 量 包 
括 :在 从 长 援助 计划 CalWork( 以 前 叫 AFDC) 中 受 援助 学 生 的 百分比 .享有 一 份 减 价 午餐 的 
学 生 的 百分比 ,以 及 学 习 英 语 的 学 生 ( 即 英语 是 其 第 二 语言 的 学 生 ) 的 百分比 。 所 有 这 些 数 
据 都 是 从 加 利 福 尼 亚 州 教育 局 得 到 的 ( www. ede. ca. gov) a 


-附录 4.2 OI1S 估计 量 的 推导 - 
本 附录 利用 微 积分 学 知识 推导 了 重要 概念 4 2 中 所 给 出 的 OLS 估计 量 的 公式 。 为 了 


使 预测 误差 的 平方 和 Y (Y, - bo -下 天 (会 式 (4.6)) 最 小 化 ,首先 分 别 对 b, FI b, RA 
导数 ， 











ED) -2DU hh) (4.44) 


Dh) = 2Y O. -b -bX (4.45) 
E r=l p= 


OLS THEA, fm ñ, EË Y (Y - ba - bX.) 最 小 的 如 和 的 值 ,或 者 说 ,使 公式 (4. 44) 
t=1 
和 公式 (4. 45) 中 的 导数 等 于 0 的 如 各 的 值 。 因 此 , 令 这 两 个 导数 等 于 0, 合 并 同类 项 ,再 
除 以 4, 这 证 明了 OLS it E Â, uñ, 一 定 满足 以 下 这 两 个 方程 : 
Y-Å, -ÊX =0 (4.46) 





m" 


LyxY -A-6 L Yx =0 (4.47) 
解 这 两 个 方程 求 出 局 MÂ, : 
YX -FF Y (x, - EMY, - Y) 
$x -y $a, -7 
ñ =Y-6,X (4.49) 
公式 (4.48)} 和 公式 (4.49) 就 是 重要 概念 4 2 PATA th BU ñ, 和 启 的 表达 式 。 通 过 将 公式 
(4. 48) 的 分 子 和 分 母 同 除 以 n-] 就 可 得 到 公式 ñ, = sp/ so 








(4.48) 





[附录 4.3_OLS 值 计量 的 抽样 分 布 - 


在 本 附录 中 ,我 们 证 明了 在 重要 概念 4. 4 中 所 给 出 的 OLS 估计 量 房 是 无 偏 的 ,并 在 大 
样本 条 件 下 B, 服从 正 态 的 抽样 分 布 。 


用 回归 因子 和 误差 项 表示 的 启 
我 们 首先 给 出 用 回 好 因子 和 误差 项 表达 的 房 的 表达 式 。 由 于 Y=B, +BX, +u, Y, — Y 
-8 (X -X) +u -元 因 此 公式 (4. 48) 中 房 公式 的 分 子 是 : 
FED -DD = $a -DIEA -D + (a, - m] 
-BY (XD + DX -D - D (4.50) 
a8 E -D-0 = X (x, - Du, - Y (O, - Dz = Y A -Du ,其 中 ,最 后 
一 个 等 趟 根 据 寂 的 定义 得 出 , 它 意 味 着 y x -DE (Yx -Dë =0, O- 
DG, - 2) = Y (x, - Du, 代入 到 公式 (4 0) 的 最 后 一 个 表达 式 中 得 出 工 (x, -DY 


-P = 8 Y (X - Xy: EX,- Du, , 接 下 来 将 这 个 表达 式 再 代入 到 公式 (4 48) 中， 


得 到 : 
l < x= 
— Y (X, -Du 
jep TAE asn 
T y (x, -I 
证 明 6, 是 无 偏 的 


通过 对 公式 (4. 51) 的 两 边 取 期 望 ,可 以 得 到 房 的 期 望 值 , 即 ; 


I LY a,- P, 
EB) =B + 有 一 一 一 一 
—Y (x, - Py 





LS (x, - DEG, X...) (4.52) 
-Bt 


th - y: 
其 中 ,公式 (4. 52) 中 的 第 二 个 等 式 根据 票 期 望 法 则 ( 见 2. 3 节 ) 得 出 。 根 据 第 二 个 最 小 二 乘 
假设 ,对 除了 第 【个 以 外 的 所 有 观测 值 而 言 , 独立 分 布 于 ,所 以 E(u LX... X.) = 
E(u |X) BRES — Aie RRR, E u 1X) =0。 因 此 ,公式 (4.52) 中 最 后 一 项 的 分 
子 为 0, 这 样 E(À,) =B ,也 就 是 说 ,0LS 估计 量 是 无 偏 的 。 


OLS 佑 计量 的 大 样本 正 态 分 布 


通过 考虑 公式 (4. 51) 中 的 最 后 一 项 的 方式 ,可 以 得 到 房 的 极限 分 布 的 大 样本 正 态 近 似 
( 见 重要 概念 4 4) 。 

首先 考虑 这 项 的 分 子 。 由 于 让 是 一 致 的 ,如 果 样 本 容量 很 大 , 则 几乎 等 于 py。 因 此， 
可 以 从 很 逼近 的 意义 上 来 说 ,等 式 (4. 51) 的 分 子 中 的 项 是 样本 均值 5, 这 里 v= (X. -pr)u。 
根据 第 一 个 最 小 二 乘 假设 ,v, 具有 和 零 均值 ;根据 第 二 个 最 小 二 葬 假 设 ,v, 是 独立 同 分 布 的 。% 
的 方差 是 oi =var[ (X -Ar)a] ;根据 第 三 个 最 小 二 乘 假 设 , 它 是 非 零 的 且 有 限 的 。 因 此 ,5 
满足 中 心 极限 定理 ( 见 重要 概念 2.7) 的 所 有 起 求 条 件 。 从 而 ,在 大 样本 条 件 下 ,5/o; 服 从 
NN(0,1) 分 布 ,其 中 gq; =o?/n。 因 此 ,的 分 布 很 好 地 被 和 (0,o2/n) 分 布 吾 近 。 

接 下 来 考虑 公式 (4. 51) 中 分 杯 的 表达 式 ,这 是 于 的 样本 方差 { 不 过 这 里 是 被 = 除 而 不 
是 被 -1 上 踪 , 如 果 * 很 大 ,这 是 无 关 紧要 的 ) 。 如 3.2 节 中 所 讨论 的 (公式 (3.8)) ,样本 方 
差 是 总 体 方 差 的 一 致 佑 计量 ,所 以 在 类 样本 条 件 下 , 它 任意 地 接近 于 区 的 总 体 方差。 

把 这 两 个 结果 结合 起 来 ,我 们 有 以 下 结论 :在 大 样本 条 件 下 , 记 -Bi =u/var( X,) ,因此 ， 
ñ, 的 抽样 分 布 在 大 样本 条 件 下 是 N(B, ,go 条 ) ,这 里 o$, =var(5)/[var( X.) ]2 = var[ (X, ~- 
n)u,]/|n[var( X.) ]' | ,这 就 是 公式 (4. 14) 中 的 表达 式 。 


关于 OLS 估计 量 的 其 他 的 一 些 代 数 结果 


OLS 残 差 和 预测 值 满足 : 
l< _ 
rp = 0 (4.53) 
1 o _ yp 
re f =Y (4.54) 
Yx, = 0,s% = 0 (4.55) 
` TSS = SSR + ESS (4.56) 


公式 {4. 53) 到 公式 (4. 56) 说 明了 OLS 残 差 的 样本 均值 是 0;0ILS 预测 值 的 样本 均值 是 
了 ; OLS 残 差 和 回归 因子 之 间 的 样本 协 方 差 sx 为 0; 总 平方 和 是 残 差 平方 和 与 被 解释 的 平方 
PZA ESS, TSS 和 SSR 分 别 定义 在 公式 (4. 35) ,公式 (4. 36) 和 公式 (4.38) 中 )。 


为 了 证 明 公 式 (4. 53) ,注意 到 房 的 定义 使 我 们 可 将 OLS 残 差 写 为 & = Y, -Â -BX = 
(Y.-F) -Å (X, - X) ,因此 : 


> = $o, - Y) -å YO -7 








YR Xma et Y O -D 0A YO Q = 0 BD. Ya =o, 


为 了 证 明 公式 (4. 54) ERRA Y, =P, +i, DA yv - 5f, ， Yá -$ra 
第 二 个 等 式 是 公式 (4. 53) 的 结果 。 
为 了 证 明 公式 (4 55) ,注意 到 Di = 0 858 Y ax = YLA,- BD: 
Dix = Xir -P -Â (X, - DJX, - X) 
= Yu -Da -D A Yu -D -0 as 


其 中 ,公式 (4.57) 中 的 最 后 一 个 等 式 是 使 用 公式 (4. 48) h ñ, 的 公式 得 到 的 。 这 个 结果 和 
前 面 的 结果 合并 在 一 起 隐 含 着 say =0。 
公式 {4. 56) 可 根据 前 面 的 结果 和 一 些 代数 运算 得 到 ， 


TSS = Do -7° = P(Y -f +f -7 
1. i=l 





= So -fy + > 他 - Y)° s25, -F -Y) 


= SSR + ESS +29 uË, = SSR + ESS (4.58) 


其 中 ,最 后 -个 等 式 是 根据 前 而 的 结果 D, = Y ¿(h 01) A Ya A Yx = 
0 得 到 的 。 


| 附录 4.4 OLS 标准 误 的 公式 | 


本 附录 讨论 OLS 标准 误 的 公式 。 这 些 公式 最 初 是 在 重要 概念 4 3 中 的 最 小 二 乘 假设 
下 提出 的 ,它们 考虑 到 了 异 方差 ,是 “ 蜡 方 差 稳健 的 "标准 误 , 然 后 给 出 了 作为 特殊 情况 的 同 
方差 的 0LS 估计 量 的 方差 ,以 及 与 之 相 联系 的 标准 误 公 式 。 


异 方差 稳健 的 标准 误 

公式 (4. 19) 中 定义 的 估计 量 5 ,可 用 相应 的 样本 方差 代 痊 公式 (4.14) 中 的 总 体 方差 
来 桨 得 ,只 是 要 做 一 些 修正 。 公 式 (4. 14) 的 分 子 中 的 方差 是 用 -7 Y. (X, - 如 ) 估计 
的 ,其 中 除数 4 -2( 而 不 是 a) 加 入 了 一 个 自由 度 调整 以 修正 向 下 的 偏差, 美 似 于 4.8 节 SER 
定义 中 所 合用 的 自由 度 调整 。 分 母 中 的 方差 中 用 二 也 O -Dit MAMME 


代替 公式 (4. 14) 中 的 var[ (X, -uy) u, JF var( X.) , 便 得 到 公式 (4.19) 中 的 6 纺 。 异 方差 稳 
健 的 标准 误 的 一 致 性 问题 在 15. 3 节 中 讨论 。 
Â 的 方差 估计 量 是 ， 





D. 





(4.59) 


sep, A, = 1 - [|l y ax, ó RRR SEBo) =V 2。 佑 计量 ¿k ati towan 
j E E FRERE B kta qa, 
IO H T+|F] y 2 ñ É 


在 同方 差 的 情况 下 ,给 定 工 条件 下 4 的 条 件 方差 是 个 常数 , 即 var(&,1X,) =o% WMR 
误差 项 是 同 方差 的 ,那么 重 鉴 概念 4.4 中 的 公式 可 简化 为 : 


g 





z =— 4.60 

gà, n i ) 
E(X) 

ah = n e (4.61) 


为 了 推导 公式 (4. 60) ,将 公式 (4. 14) 中 的 分 子 写 为 var[ (X, - Pa )u,] E(X, —par )u, 
- E| (X, —pjex) u, ] 1°) = 下 | [ (X. -uu J} =E[ (X. — ux) u, ] =E[(X, — py) var( u, | 
X) . ,这 里 第 一 个 等 式 是 根据 ECX, -px)u,] =0 得 到 的 (根据 第 一 个 最 小 二 乘 假设 ) ,而 最 
后 一 个 等 式 是 根据 辕 期 望 法 风 ( 见 2.3 节 ) 得 到 的 。 如 果 是 同方 差 的 ,那么 var( u, lX.) = 
本 ,所 以 EL CX 一 px) var(w | X,)] = osB[(X -px) ] = asya 将 这 个 表达 式 代 人 公式 
(4. 14) 的 分 子 中 并 化 简 ,就 得 到 公式 (4 60) 中 的 结果 。 类 似 的 计算 可 得 到 公式 (4. 61)。 


仅 适 用 于 同方 差 的 标准 误 


用 样本 均值 .方差 分 别 代替 公式 (4. 60) 和 公式 (4.61) 中 的 总 体 均 值 与 方差 ,并 用 SER 
的 平方 来 估计 & 的 方差 ,就 可 得 到 仅 适用 于 同方 差 的 标准 误 。 这 些 方差 的 仅 适 用 于 同方 差 
的 估计 莉 为 : 


3 
A =- ATATA) (4.62) 
Y (x, - Xy 
(+y 
Ta = 一 一 ( 仅 适 用 于 同方 卷 的 ) (4.63) 
>, -Xy 


其 中 , 纺 在 公式 (4. 40) 中 给 出 。 仅 适用 于 同方 差 的 标准 误 是 5 多 和 oa FAR, 
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第 4 章 以 一 个 使 人 困 总 的 评论 铬 束 。 在 加 利 福 尼 亚 则 数据 集中 ,尽管 学 生 一 教师 比较 
短 的 地 区 倾向 于 有 较 高 的 考试 成 绩 , 但 来 自 于 小 班 地 区 的 学 生 也 有 可 能 捉 有 其 他 一 些 有 助 
于 他们 在 标准 化 者 试 中 豪 现 好 的 优 热 。 这 个 问题 是 否 令 人 费解 ? 如果 是 ,我 们 应 该 起 样 解 
决 呢 ? 

我 们 在 使 用 普通 最 小 二 来 法 (01LS) 估计 出 的 班级 规模 对 考试 成 绩 影响 效应 的 估计 量 
中 ,由 于 遗漏 了 像 学 生 特征 这 样 的 因素 ,因此 会 产生 误导 性 的 结论 ,或 者 更 确切 地 说 ,产生 仿 
差 。 本 章 中 我 们 解释 了 这 个 “被 遗漏 的 变量 所 导致 的 偏差 ” ,并 引入 了 多 元 回归 方法 ,这 种 
方法 是 一 种 能 够 前 减 遗 漏 京 量 偏差 的 方法 。 多 元 回归 方法 的 关键 思想 是 :如 果 我 们 有 关于 
这 些 遗 漏 变 量 的 数据 ,那么 我 们 就 能 把 它们 必 为 额外 的 国 归 因子 包 揪 进 来 ,从 而 在 保持 其 他 
变量 { 如 学 生 特 征 ] 不 变 的 条 性 于 巾 计 单个 回归 因子 (学 生 一 教师 比 ) 的 效 襄 。 

杰 章 解释 说 明了 如 何 估计 多 元 线性 回 妇 模 型 的 系数 ,仔细 研究 了 如 何 进行 统计 推断 , Ep 
如 何 答 验 关于 多 个 回 妇 系数 的 假设 和 如 何 构造 那些 系数 的 置信 区 间 。 多 元 回归 的 许多 方面 
与 第 4 章 中 所 研究 的 一 元 回归 相似。 多 元 回归 横 想 的 系数 也 可 以 使 用 OLS 方法 根据 样本 
数据 进行 估计 ;多 元 回归 的 DOLS 估计 量 也 是 随机 变量 ,因为 它们 所 依赖 的 数据 也 是 从 随机 
样本 中 得 到 的 ;在 大 样本 中 ,0LS 估计 量 的 抽 社 分布 也 是 渐 近 正 态 的 ;0OLS 估计 量 也 可 被 用 
来 对 总 体 回归 系数 作 假设 科 验 和 构造 置信 区 间 。 这 样 一 个 可 检验 的 假设 是 :在 保持 该 地 区 
可 测度 的 学 生 特征 不 变 的 情况 下 ,降低 学 生 一 教师 比 对 者 试 成 绩 没 有 影响 。， 


-5. 1 遗漏 变量 侦 差 1 


š 由 于 只 研究 学 生 一 教师 比 这 一 变量 ,因此 ,第 4 章 中 的 实证 分 析 忽略 了 一 些 潜在 的 可 能 
+ 决定 考试 成 绩 的 重要 因素 ,而 这 些 可 能 的 重要 因素 的 影响 是 通过 回归 误差 项 反映 的 。 这 些 
被 遗漏 的 因素 包括 :学 校 特征 ,如 教师 素质 和 计算 机 的 使 用 情况 ;学 生 特 征 ,如 家 庭 背 景 。 我 
们 首先 考虑 一 个 被 遗漏 的 学 生 特 征 , 即 该 校区 中 仍然 在 学 习 英 语 的 学 生 的 比例 ,这 个 指标 之 
所 以 在 加 利 福 尼 亚 州 特别 重要 是 因为 该 州 拥有 大 量 的 移民 人 口 。 





p 


由 于 忽略 了 这 个 地 区 英语 学 习 者 的 百分比 ,因此 ,我 们 所 估计 的 考试 成 绩 对 学 生 一 教师 
比 的 回归 斜率 的 OLS 全 计量 可 能 是 有 含 的 , 即 OLS 估计 量 的 抽样 分 布 的 均值 可 能 不 等 于 学 
生 一 教师 比 的 单位 变化 对 考试 成 绩 影响 的 真实 效应 。 我 们 做 以 下 推理 : 仍 在 学 英语 的 学 生 
在 标准 化 考试 中 可 能 会 比 把 英语 作为 母语 的 学 后 表现 得 差 。 如 果 大 班 型 的 地 区 中 学 习 英 语 
的 学 生 也 很 多 ,那么 考试 成 绩 对 学 生 一 教师 比 的 OLS 回归 可 能 会 得 到 错误 的 相关 关系 ,并 
得 到 一 个 较 大 的 估计 系数 ,而 削减 班级 规模 对 考试 成 绩 的 真实 因果 效应 实际 上 可 能 是 很 小 
的 ,其 至 是 零 。 因 此 ,根据 第 4 章 的 分 析 ,该 教育 主管 可 能 会 雇佣 足够 多 的 新 教师 以 使 学 生 
一 教师 比 减 少 2 个 单位 ,但 是 如 果真 实 的 系数 很 小 或 是 零 ,那么 她 原本 希望 考试 成 绩 提 高 的 
愿望 将 不 会 实现 。 

看 一 下 加 利 福 尼 亚 州 的 数据 就 可 为 这 一 点 提供 证 据 。 该 地 区 学 生 一 教师 比 和 英语 学 习 
者 ( 即 那 些 英 语 不 是 母语 的 学 生 以 及 那些 还 未 掌握 英语 的 学 生 ) 的 百分比 之 间 的 相关 系数 
为 0. 19。 访 个 很 小 但 却 正 的 相关 系数 表明 ,英语 学 习 者 越 多 的 地 区 倾向 于 有 更 高 的 学 生 一 
教师 比 ( 较 大 的 班级 规模 ) 。 如 果 学 生 一 教师 比 与 英语 学 习 者 的 百分比 不 相关 ,那么 在 考试 
成 绩 对 学 生 一 教师 比 的 回归 分 析 中 ,忽略 英语 熟练 程度 这 一 因素 将 是 安全 的 。 但 由 于 学 生 
一 教师 比 与 英语 学 习 者 的 百分比 之 间 是 相关 的 ,因此 在 考试 成 绩 对 学 生 一 教师 比 的 回归 中 ， 
所 得 出 的 OLS 系数 就 有 可 能 反映 了 这 种 影响 。 


511 遗漏 变量 仿 差 的 定义 


如 果 回 归 因 子 {( 学 生 一 教师 比 ) 与 回归 分 析 中 已 遗漏 的 某 个 变量 (英语 学 习 者 的 百 分 
比 ) 相 关 , 而 且 访 变量 部 分 地 决定 因 变 量 { 考试 成 绩 } 的 变化 ,那么 该 0LS 估计 量 将 会 存在 遗 
TERAZ (omitted variable bias), 

METEM RFR ,那么 就 会 发 生 遗 漏 变量 偏差 ;第 一 ,遗漏 变 量 与 包含 在 回 妇 方 
程 中 的 回归 因子 相关 ;第 二 ,遗漏 变量 是 因 变量 的 一 个 决定 因素 。 为 了 举例 说 明 这 些 条 件 ， 
我 们 用 三 个 例子 来 说 明 考 试 成 绩 对 学 生 一 教师 比 回 归 中 遗漏 变量 的 问题 。 

例 工 荣 诸 学 习 吉 的 百分比 。 由 于 英语 学 习 者 的 百分比 与 学 生 一 教师 比 是 相关 的 ,因此 
吐 潮 变量 偏差 的 第 一 个 条 件 成 立 。 那 些 仍 在 学 习 英语 的 学 生 在 标准 化 考试 中 的 表现 要 比 说 
黄 语 母语 的 学 生 差 似乎 是 侣 理 的 ,在 这 种 情况 下 ,英语 学 习 者 的 百分比 是 影响 考试 成 绩 的 一 
个 决定 性 因素 ,从 而 遗漏 变量 偏差 的 第 二 个 条 件 成 立 。 因 此 ,考试 成 绩 对 学 生 一 教师 比 回归 
中 的 OLS 佑 计量 可 能 错误 地 反映 了 遗漏 变量 即 英 语 学 习 者 的 百分比 的 影响 。 也 就 是 说 , m 
漏 英语 学 习 者 的 百分比 这 一 变量 可 能 会 引致 遗漏 变 量 偏差。 

例 2 :安排 考试 的 时 间 。 分 析 中 遗漏 的 另 一 个 变量 是 安排 考试 的 时 间 。 对 这 个 遗漏 变 
量 而 言 ,遗漏 变量 往 差 的 第 一 个 条 件 不 成 立 , 但 第 二 个 条 件 成 立 , 这 似乎 是 合理 的 。 合 如, 如 
果 考 试 时 间 的 安排 以 一 种 与 班级 规模 不 相关 的 方式 在 地 区 间 变 化 ,那么 考试 时 间 安 排 与 班 
级 规模 就 会 不 相 关 ,所 以 第 一 个 条 件 也 就 不 成 立 。 另 一 方面 ,考试 时 间 的 安排 可 能 会 影响 考 
试 成 绩 ( 学 生 思 维 的 敏捷 性 在 一 天 中 的 不 同时 间 是 不 同 的 ) ,因此 第 二 个 条 件 成 立 。 然 而 ， 
在 这 个 例子 中 ,由 于 安排 考试 的 时 间 和 学 生 一 教师 比 是 不 相关 的 ,因此 学 生 一 教师 比 不 会 异 
误 地 把 "日 间 效 应 ”反映 进来 。 所 以 这 里 遗漏 考试 时 间 安 排 这 一 因素 不 会 导致 遗 潮 变 量 
偏差 。 

例 3: 平 均 每 个 学 生 的 停车 上 场 空间 。 另 一 个 遗漏 变量 是 每 个 学 生 的 停车 场 空间 {教师 停 
车 场面 积 除 以 学 生 数 )}。 这 个 变量 满足 跟 漏 变量 偏差 的 第 一 个 条 件 , 但 不 满足 第 二 个 条 件 。 
具体 地 讲 , 每 个 学 生 对 应 较 多 的 老师 的 学 校 可 能 会 有 较 大 的 教师 停车 场 空间 ,所 以 第 一 个 条 














件 会 被 满足 。 然 而 ,在 “学 习 是 在 教室 里 而 不 是 在 停车 场 上 进行 的 "这 一 假设 下 ,停车 场 空 
间 对 学 习 没有 直接 影响 , 因 坝 第 二 个 条 件 不 成 立 。 因 为 每 位 学 生 的 停车 场 空间 不 是 考试 成 
绩 的 决定 性 因素 ,所 以 分 析 中 遗漏 此 变量 不 会 导致 得 潮 变 量 偏差 。 

关于 进 漏 变量 偏差 的 概要 解释 ,总 结 在 重要 概念 5. 1 中。 

Himki- :个 最 小 kit. Amr ENET kA tah ERE 
EH E(u 1X.) =0, 如 在 重要 概念 4. 3 中 所 列 出 的 一 一 是 不 正确 的 。 为 了 理解 其 原因 ,回想 一 
下 ,一 元 线性 回归 模型 中 的 误差 项 & 代表 了 除 之 外 决定 的 所 有 其 他 因素 。 如 果 这 些 
其 他 因素 中 有 一 个 与 相关 ,那么 这 就 意味 着 误差 项 u.( 它 包含 这 个 因素 ) 与 是 相关 的 . 
换血 话说 ,如 果 人 遗漏 变 量 是 了 的 一 个 决定 性 因素 ,那么 它 就 在 误差 项 中 ,而 如 果 它 与 文 相 
关 , 那 么 误差 项 就 与 X, WK. HF u 与 是 相关 的 ,因此 给 定 马 FTF u 的 条 件 均值 就 
是 非 零 的 。 所 以 ,这 个 相关 性 违背 了 第 一 个 最 小 二 乘 假设 ,其 后 果 是 严重 的 :OLS 的 估计 量 
是 有 偏 的 。 这 个 偏差 即使 在 非常 大 的 样本 中 也 不 会 消失 ,而 且 OL 的 估计 量 也 是 不 一 
致 的 。 


5.1.2 遗漏 变量 偏差 的 计算 公式 
前 一 部 分 关于 遗漏 变量 偏差 的 讨论 在 数学 上 可 用 一 个 公式 对 其 进行 概括 。 令 尘 与 & 
之 间 的 相关 系数 为 cor(X u) =px,。 假 定 最 小 二 乘 假 设 的 第 二 个 各 第 三 个 假设 成 立 ,但 第 
一 个 假设 不 成 立 ,因为 px 是非 零 的 ,那么 OLS 估计 量 有 极限 (推导 见 附录 5.1) EI; 
Ê Zg, + (5.1) 


也 就 是 说 , 随 着 样本 容量 的 增加 ,B, MEANE ERRET B. tp ° 


重要 概念 $. 1 
一 元 回归 中 的 遗 泗 变量 偏差 

遗漏 变量 偏差 是 指 当 回 归 因 子 壮 与 过 漏 变量 相关 时 OLS 估计 量 中 出 现 的 偏差 。 要 发 
生 遗 淹 变 量 偏差 ,两 个 条 件 必须 为 真 : 

1.X 与 遗漏 变量 相关 ; 

2. 踢 油 变量 是 因 变 量 了 的 一 个 决定 性 因素 。 

表达 式 (5.1) 中 的 公式 概括 了 上 面 讨论 的 关于 遗漏 变量 偏差 的 几 个 思想 ， 

1. 洁 泼 变 量 偏差 是 一 个 不 论 样本 容量 是 大 还 是 小 都 会 存在 的 问题 。 由 于 Á, 并 不 依 概 
率 收 伍 于 真实 值 8 ,因此 包 不 是 一 致 性 的 。 也 就 是 说 , 当 存在 遗漏 变量 偏差 时 ,名 不 是 p. 
的 一 致 性 估计 量 。 表 达 式 (5. 1) 中 的 px. 项 就是 即使 在 大 样本 条 件 下 依然 存在 的 À, 的 
RË. 

2 在 实际 中 ,这 个 偏差 是 大 还 是 小 ,依赖 于 回归 因子 和 误差 项 之 间 的 相关 系数 pu。 
iou1 越 大 ,偏差 就 越 大 。 

3. ñ, 中 偏差 的 方向 依赖 于 于 和 u 之 间 是 正 相关 还 是 负 相关 。 例 如 ,我 们 推测 学 习 英 语 


的 学 生 百分比 对 地 区 考试 成 绩 有 负 效 应 ( 仍 在 学 英语 的 学 生 有 较 低 的 分 数 ) ,所 以 英语 学 习 
者 的 百分比 友 负 号 进入 误差 项 。 在 我 们 的 数据 中 ,由 于 英语 学 习 者 的 百分比 与 学 生 一 教师 


比 是 正 相关 的 ( 有 较 多 英语 学 习 者 的 地 区 有 较 大 的 班级 规模 ) ,因此 ,学 生 一 教师 比 (X) sS E 
差 项 (4) 将 会 是 负 相 关 的 , 即 py, <0, 学 生 一 教师 比 的 系数 育 将 会 偏向 于 负数 。 换 句 话说 ， 
具有 较 小 的 英语 学 习 者 百分比 , 既 与 高 的 考试 成 绩 相 关联 ,也 与 低 的 学 生 一 教师 比 相 关联 。 
所 以 ,OIS 估计 量 显示 出 小 的 班级 规模 改进 了 考试 成 绩 ,导致 这 一 结论 的 一 个 原因 可 能 是 小 
班 地 区 有 较 少 的 英语 学 习 者 。 

5.1.3 通过 将 数据 分 组 来 处 理 遗 漏 变量 偏差 

对 于 寺 漏 变量 偏差 ,你 能 做 些 什 么 ? 我 们 的 教学 主管 正 考虑 增加 其 所 在 地 区 的 教师 数 
量 , 但 是 她 无 法 控制 其 所 在 社区 中 移民 人 数 的 百分比 。 其 结果 是 ,她 对 学 生 一 教师 比 对 考试 
成 绩 的 影响 感 兴趣 ,而 保持 其 他 的 因素 不 变 , 包 括 黄 请 学习 者 的 百分比 。 现 在 我 们 用 一 种 新 
的 方式 提出 了 教育 主管 的 问题 ,这 种 方式 表明 ,我 们 可 能 应 该 集中 关注 那些 英语 学 习 者 的 百 
分 比 可 以 和 该 教育 主管 所 在 地 区 该 指标 具有 可 比 性 的 地 区 ,而 不 是 所 有 地 区 的 数据 。 在 这 
些 地 区 的 数据 子 集 中 ,那些 规模 较 小 班级 的 地 区 在 标准 化 考试 中 会 做 得 较 好 玛 ? 

RS 报告 了 英语 学 习 者 的 百分比 具有 可 比 性 的 地 区 班级 规模 和 考试 成 绩 之 间 关 系 
的 证 据 。 所 有 地 区 被 分 成 8 组 。 首 先 ,对 应 于 各 个 地 区 的 英语 学 习 者 百分比 数据 分 布 的 四 
分 位 数 ,将 这 些 地 区 分 成 四 类 ;然后 ,在 这 四 类 地 区 中 ,每 一 类 地 区 又 进一步 被 划分 为 两 组 ， 
这 取决 于 学 生 一 教师 比 是 小 的 (37R <20) 还 是 大 的 (STR 关 20)。 





大 5 一 ! 加 利 手 尼 亚 州 学 区 考试 成 绩 的 差异 与 离 惰 学 生 一 教师 比 数据 
( 按 该 地 区 英语 学 习 者 的 百分比 进行 分 组 } 
学 生 一 教师 比 <20 学 生 一 教师 比 #20 WE STR 的 考试 成 绩 差 异 
THERI n THERIA n 差异 1 统计 时 





所 有 地 区 657.4 238 650. 0 182 7.4 4.04 


英 示 学 习 者 的 百分比 
<2. 2 名 664. 1 78 665.4 27 -1.3 -0.44 





2.2% ~8, 8% 666.1 61 661. 8 44 4.3 1.44 
8. 8% ~ 23. 0% 654.6 55 649, 7 50 4.9 1. 64 
>23. 0% 636.7 4 634.5 6l 1.9 0.68 
— 1 
般 兴 趣 杠 


莫扎特 [Mozart) 效应 ;存在 遗漏 变量 储 差 吗 

1993 年 《自然 }》 杂 志 上 发 表 的 一 篇 论文 (Rauscher,Shaw,Ky,1993) 提出 , 听 莫 扎 特 的 昌 
子 10 ~15 分 钟 会 暂时 使 你 的 IQ 提高 8 或 9 分 。 该 项 研究 引起 了 很 大 的 秦 动 一 一 政治 家 们 
和 父母 们 看 到 了 使 他 们 的 孩子 变 得 更 聪明 的 一 种 容易 的 方法 。 有 一 段 时 间 里 ,佐治 亚 州 其 
至 向 该 州 所 有 滩 几 分 发 古典 音乐 CD。 

“莫扎特 效应 "的 证 据 是 什么 ? 某 人 在 对 许多 研究 成 果 做 出 总 结 性 研究 后 发 现 ,那些 在 
高 中 选修 音乐 或 丰 术 课程 的 学 生 的 英语 和 数学 考试 成 绩 确实 比 那些 没有 选修 该 类 课程 的 学 
生成 绩 高 .2 然而 ,更 深入 地 分 析 这 些 研究 成 果 你 会 发 现 ,拥有 较 好 的 考试 成 绩 的 真正 原因 
和 拖 些 课程 几乎 没有 关系 。 相 反 , 这 篇 总 结 性 研究 的 作者 提出 , 考 得 好 和 上 艺术 或 音乐 课 之 
间 的 相关 关系 可 能 是 由 许多 剖 情 引起 的 。 例 如 ,学 习 较 好 的 学 生 可 能 会 有 更 多 的 时 间 去 选 
修 音 乐 谍 ,或 对 选修 这 些 课程 有 更 多 的 兴趣 ,或 那些 有 较 深 的 音乐 课程 的 学 校 恰好 是 各 学 校 














中 较 好 的 学 校 。 

用 回归 术语 来 说 ,所 个 计 的 考试 成 绩 和 选修 音乐 课程 之 间 的 关系 看 起 来 似乎 存在 遗漏 
变量 偏差 。 由 于 遗 沁 了 因素 ,诸如 学 生 天 赋 或 学 校 整体 质量 ,学 习 音乐 表面 上 看 对 考试 成 绩 
有 影响 ,但 实际 上 它 对 考试 成 绩 并 没有 影响 。 

那么 ,莫扎特 效应 到 底 存 在 不 存在 ?” 找 出 结论 的 一 种 方法 是 进行 随机 化 控制 实验 {如 
在 第 11 章 进一步 讨论 的 ,随机 化 控制 实验 通过 将 参与 者 随机 地 分 配给 处理" 组 和 ”控制 ” 
组 来 剔除 遗 油 变 量 偏差 ) 。 把 所 有 研究 结果 都 放 到 一 起 ,发 现 许多 莫扎特 效应 的 控制 实验 
没有 表明 听 莫 扎 特 的 曲子 会 提高 IQ 或 提高 通常 的 考试 成 绩 。 然 而 ,由 于 某 些 无 法 完全 理解 
的 原因 , 昕 古典 音乐 在 一 个 狭 这 的 领域 内 确实 暂时 地 有 帮助 :折纸 和 想像 形状 。 所 以 下 次 你 
在 为 折纸 乎 工 考试 而 死记 万 背 时 ,也 试 着 谁 备 听 一 些 莫扎特 的 曲子 。 

注 : 作 Journal of Aesthetic Education 34; 3 — 4 ( Fall/Winter 2000), especially the article by Ellen Winner 
and Monica Cooper ( pp. 11 — 76) and the one by Lois Hetland ( pp. 105 - 148) 。 

3 5 一 1 中 的 第 一 行 给 出 了 高 低 学 生 一 教师 比 地 区 之 各 平均 考试 成 绩 的 总 体 差 异 , 即 在 
没有 将 其 进一步 分 成 英语 学 习 者 的 如 分 位 数 的 条 件 下 ,这 两 组 考试 成 绩 之 间 的 差异 。( 回 
想 一 下 ,这 个 差异 在 前 而 的 回归 方程 (4. 33) 中 就 被 报告 过 , 它 是 在 对 D. 的 TestSeore 的 回归 
方程 中 作为 D, 系数 的 OLS 估计 值 被 报告 出 来 ,其 中 p, 是 个 二 元 回归 因子 , 若 STR, <20, 则 
D. 等 于 1 ,否则 已 等 于 0) 在 420 个 地 区 的 全 样本 中 , 低 学 生 一 教师 比 地 区 的 平均 考试 成 绩 
比 高 学 生 一 教师 比 地 区 的 考试 成 绩 高 7. 4 分 ,! 统计 量 为 4.04, 所 以 这 两 组 平均 考试 成 绩 是 
相同 的 零 假设 在 1 名 的 显著 水 平 下 被 拒绝 。 

表 5 一 1 中 的 后 四 行 给 出 了 按照 英语 学 习 者 百分比 数据 分 布 的 四 分 位 数 来 划分 的 高 低 
学 生 一 教师 比 地 区 之 间 的 平均 考试 成 绩 差异 值 。 这 个 证 据 显 示 了 一 种 不 同 的 结论 。 在 英语 
学 习 者 最 少 ( <2.2% ) 的 地 区 中 ,78 个 低 学 生 一 教师 比 地 区 的 平均 考试 成 绩 为 664. 1 ,而 27 
个 高 学 生 一 教师 比 地 区 的 平均 考试 成 绩 为 665. 4。 因 此 ,对 英语 学 习 者 较 少 的 地 区 而 言 , 具 
有 较 低 学 生 一 教师 比 地 区 的 考试 成 绩 比 具有 较 高 学 生 一 教师 比 地 区 的 考试 成 绩 平均 看 来 要 
低 1.3 分 ;在 第 二 个 四 分 位 数 中 , 低 学 生 一 教师 比 地 区 比 高 学 生 一 教师 比 地 区 的 考试 成 绩 平 
均 高 出 4.3 分 ;对 第 三 个 四 分 位 数 而 言 ,这 个 差距 是 4.9 分 ;而 对 英语 学 习 者 最 多 的 四 分 位 
数 的 地 区 而 言 ,这 个 差距 只 有 1.9 分 。 一 旦 我 们 保持 英语 学 习 者 百分比 这 个 指标 不 变 , 高 低 
学 生 -一 教师 比 地 区 之 同 的 考试 成 绩 的 差异 可 能 是 这 个 总 体 估 计 值 7.4 分 的 -- 半 (或 更 少 )。 

起 初 这 个 发 现 可 能 令 人 困惑 。 考 试 成 绩 的 整体 效应 怎么 可 能 是 任何 一 个 四 分 位 数 考试 
成 绩效 应 的 两 倍 呢 ? 答案 是 英语 学 习 者 最 多 的 地 区 倾向 于 有 最 高 的 学 生 一 教师 比 和 最 低 的 
考试 成 绩 。 最 低 和 最 高 英语 学 习 者 百分比 的 四 分 位 数 地 区 之 同 的 平均 考试 成 绩 差 异 很 大 ， 
约 为 30 分 。 英 语 学 习 者 少 的 地 区 倾向 于 有 较 低 的 学 生 一 教师 比 : 在 英语 学 习 者 的 第 一 个 四 
Ay fu Wq 14% (78/105) 的 地 区 有 小 班 {STR <20) ,而 在 英语 学 习 者 最 多 的 四 分 位 数 内 只 有 
42 多 (447105) 的 地 区 有 小 班 。 所 以 ,英语 学 习 者 最 多 的 地 区 有 比 其 他 地 区 做 的 考试 成 绩 ， 
还 有 比 其 他 地 区 高 的 学 生 一 教师 比 。 

这 个 分 析 加 大 了 教育 主管 的 烦恼 , 即 在 考试 成 绩 对 学 生 一 教师 比 的 回归 分 析 中 存在 遗 
滑 变 量 偏差 。 通 过 在 英语 学 习 者 百分比 的 四 分 位 数 内 进行 观察 , 表 5 一 1 第 二 部 分 中 的 考试 
成 绩 差异 比 表 5 一 ! 第 一 行 中 表现 的 简单 均 什 差 有 所 改进 。 尽 管 如 此 ,在 保持 英语 学 习 者 的 
百分比 不 变 的 条 件 下 ,这 个 分 析 仍 然 没 有 为 教育 主管 提供 一 个 改变 班级 规模 对 考试 成 绩 的 
影响 的 有 用 估计 值 。 不 过 ,使 用 多 元 回归 的 方法 能 够 提供 一 个 这 样 的 估计 值 。 











而 ,正如 一 元 回归 中 的 情况 - : 样 , 这 个 关系 不 会 精确 地 成 立 , 因 为 有 许多 其 他 因素 影响 着 因 
变量 。 例 如 ,除了 学 年 一 教师 比 和 仍 在 学 习 英 语 的 学 生 百 分 比 外 ,考试 成 绩 还 受到 学 校 特 
TE .其 他 学 生 特征 和 学 后 运气 的 影响 ,因此 ,需要 将 公式 (5.2} 中 的 总 体 同 归 函 数 扩 大 ,以 加 
入 这 些 额外 的 因素 。 

正如 一 元 回归 中 的 情 六 一样, 栈 了 ,和 XX 之 外 ,决定 了 的 因素 都 被 当做 误差 项 可 
人 到 公式 (5.2) 中 了 ， 这 个 误差 项 是 特定 的 观察 值 (在 我 们 的 例子 中 为 第 i 个 地 区 的 考试 成 
绩 ) 与 平均 总 体 关 系 的 偏差 , 因 比 ,我 们 有 : 

Y, =B +B Xu +B.A tu t=l ,n,n (5.5) 
这 里 ,下 标 i 代 表 样 本 中 个 观察 值 (地 区 ) 中 的 第 i 个 。 

公式 (5.5) 是 当 有 其 个 回归 因子 X A X, BJ BJ S S c B] 448 83 ( population multiple 
regression model) 。 

在 售 有 二 元 回归 因子 的 回归 中 ,将 房 看 做 为 恒 等 于 1 的 回归 因子 的 系数 是 很 有 用 的 ， 
可 将 局 看 做 是 ,的 系数 ,这 里 ,对 于 =1,…,n, 有 ,=1。 因 此 ,公式 (5.5) 中 的 总 体 多 元 
回归 模型 可 改写 成 : 

Y. =BX rB. XI tA tu AE Xp =i, =l, n (5.6) 
公式 t5.5) 和 公式 (5,6) 这 两 种 表示 总 体 多 元 回归 模型 的 方法 是 等 价 的 。 

到 目前 为 止 ,我 们 的 讨论 一 直 集 中 于 额外 增加 一 个 变量 总 的 情形 。 然 而 实际 上 ,可 能 
有 多 个 因素 被 单个 回归 因子 模型 遗漏 掉 了 。 例 如 ,就 像 忽 路 英语 学 习 者 的 百分比 一 样 ,忽略 
学 生 的 经 济 背景 也 可 能 会 导 臻 遗漏 变 量 偏 差 。 这 个 推理 引导 我 们 考虑 一 个 合 有 三 个 回归 天 
子 的 模型 ,或 更 一 般 地 说 , 傅 有 个 回归 因 于 的 模型 。 合 有 个 遂 妇 因子 各, Aa AI 
多 元 回归 模型 在 重要 概念 5.2 中 总 结 。 

多 天 回归 模 型 中 的 同方 着 和 异 方 差 的 定义 类 似 于 单个 如 归 因 子 模型 中 同方 差 和 异 方 差 
的 定 疼 。 在 多 元 回归 模型 中 ,如 果 给 定 X. X... X. u, 的 条 件 分 布 的 方差 var( u, X... Xa, 
r. X. ) 对 于 所 有 的 i=1,…,n 都 是 不 变 的 ,进而 不 依赖 于 XXa A WE A 
u, 就 是 同方 差 的 {homoskedastic} ,否则 ,误差 项 就 是 异 方差 的 [heteroskedastic ) 。 

多 元 回归 模型 可 以 解雇 前 面 的 教育 主管 所 要 解决 的 问题 , 即 改变 学 生 一 教师 比 对 考试 
成 绩 的 影响 ,同时 对 她 所 不 能 控制 的 因素 保持 不 变 ,这些 因 素 不 仅 包 含 英语 学 习 者 的 百 分 
出 ,还 包含 其 他 可 能 会 影响 考试 成 绩 的 可 测度 的 因素 ,如 学 生 的 经 济 背 景 。 然 而 ,为 了 给 教 
育 主 管 提供 实际 的 帮助 ,我 们 需要 为 她 提供 利用 样本 数据 计算 的 总 体 回归 模型 的 未 知 总 体 
系数 B,,B;,… ,Bs 的 估计 值 。 幸 运 的 是 ,这 些 系 数 可 用 OLS 进行 估计 。 


重要 概念 5.2 





多 元 同 归 模 型 
多 元 回归 檬 型 是 ; 
Y =ñ, +B.X,, +B,X, + +B.X. tu il, en (5.7) 

其 中 : 
s 了 ENTANS i TURE: X, X... ,是 上 个 回归 因子 中 每 一 个 的 第 i 个 观察 
u, 是 误差 项 。 

e 总 体 回归 线 是 总 体 中 平均 来 看 在 了 和 和 多 个 革 之 间 成 立 的 关系 : 

E(YIX, =x X, ms i X, =z.) = +B, X, +B,X, + + BY, 
。 Pp 是 X 的 斜率 系数 A 是 瑟 的 笠 率 系数 , 依 此 类 推 。 系 数 B EX, X. ET 


不 变 的 情况 下 ,由 工 , 单 位 变化 所 引起 的 Y, 的 期 望 变化 。 其 他 X 变量 的 系数 也 可 类 似 地 进 
行 解释 。 

-RIE f EHNA E AX RAFA Y HWRE RETRE REHAT 的 系数 ,对 
于 所 有 的 i 它 都 等 于 1， 


5.3_ 多 元 回归 中 的 OLS 估计 量 


本 节 找 述 了 如 何 使 用 OLS 估计 多 元 回归 模型 的 系数 。 


5.3.1 OLS 估计 量 


在 4.2 节 中 ,我 们 说 明了 如 何 根据 了 和 多 的 一 个 样本 观察 值 ,运用 OLS 方法 悄 计 单个 
回归 因子 模型 中 的 裁 距 和 斜率 系数 ,其 中 关键 的 思想 是 ,通过 最 小 化 预测 误差 平方 和 , 即 通 


过 选择 佑 计量 如 ab, 使 得 > CY, -bo -b XO 的 值 最 小 来 估计 这 些 系 数 ,这 样 得 到 的 估计 


ERE OLS 知 计 量 房 MÊ 。 

OLS 方法 也 可 用 来 估计 多 元 回归 模型 中 的 系数 Bo ,B81，… ,Bo F bodd N Bopi» 
"B 的 估计 量 , 使 用 这 些 千 计 量 所 计算 的 了 OWAE b +b Xn tee +b.X, ,Y, 的 预测 误差 
Je Y - (b; tb ++) EY, ba -b Xn obno AM FRAR n AARE, 
些 预 测 误差 的 平方 和 为 ; 








y -bh -bA 一 一 hn) (5.8) 
表达 式 (5. 8) 中 的 线性 回归 模型 的 误差 平方 和 是 表达 式 (4.5) 中 所 给 出 的 单个 回归 因子 线 
性 回归 模型 的 误差 孕 方 租 的 扩展 形式 。 


使 表达 式 ($.8) 的 误差 平方 和 最 小 的 系数 B,,B,,… ,Bi 的 估计 量 被 称 为 6, ,86,,… B, 的 
普通 最 小 二 乘 10LS) 佑 计量 {ordinary least squares estimator), OLS Ait RRRA ÂÂ, 
... Pio 

多 元 线性 回归 模型 中 OLS 的 术语 与 一 元 线性 回归 模型 中 的 术语 相同 。OLS 回归 线 
(OLS regression line) 是 使 用 OLS (Att RAEN ER, E ó, +Â X, +… +A,X,, iE OLS 
回归 线 , 给 定 X,,… Xa RIET Y, BJ MARHE ( predicted value) ° f, =Â, +Å: X, + + 以 Xo 
第 i 个 观察 值 的 OIS RÆ (OLS residual) 是 了 与 它 的 OLS 预测 值 之 差 , 即 OLS RÆ u, = 
Y -F. 

OLS 估计 量 可 以 通过 反复 淮 试 不 同 的 b... b, 的 值 ,经 试验 计算 ,直到 你 满意 地 认为 
表达 式 (5.8) 中 的 总 平方 和 已 达到 最 小 为 止 。 不 过 ,使 用 微 积分 学 知 误导 出 的 0LS 估计 量 
的 显 性 表达 式 是 更 容易 的 。 多 元 回归 模型 中 的 OLS 估计 基 的 表达 式 与 重要 概念 4. 2 中 单 
个 回归 因子 模型 中 估计 景 的 表达 式 类 似 。 这 些 表达 式 被 加 入 到 现代 统计 软件 中 。 在 多 元 回 
归 模 型 中 ,表达 式 最 好 用 矩阵 符号 来 表示 和 讨论 ,所 以 它们 的 介绍 被 推迟 到 16. 1 Yr. 

多 元 回归 中 OL 的 定义 和 术语 在 重要 概念 5.3 中 总 结 。 


5.3.2 在 考试 成 绩 和 学 生 一 教师 比 案例 中 的 应 用 
在 4.2 节 ,我 们 利用 加 利 福 尼 亚 州 校区 中 的 420 个 观察 值 ,使 用 OLS 法 估计 了 考试 成 绩 











( TestScore) 与 学 生 一 教师 比 (S7R) 回归 中 的 截 距 和 斜率 系数 。 在 方程 (4.7) 中 报告 的 所 估 
计 的 OLS 回归 线 是 ， 

—— 

TestScore = - 698. 9 — 2. 28 x STR (5.9) 


我 们 一 直 在 担心 这 个 关系 可 能 会 产生 误导 ,因为 学 生 一 教师 比 可 能 会 忽略 在 大 班 中 有 
很 多 英语 学 习 者 这 一 因素 对 考试 成 绩 的 影响 ,也 就 是 说 ,OLS 估计 量 存在 遗漏 变量 偏差。 

现在 我 们 正 通过 使 用 OLS 方法 估计 多 元 回归 模型 来 处 理 这 个 问题 ,在 这 个 多 元 回归 中 ， 
因 变 量 是 考试 成 绩 ( 世 ) ,并 有 两 个 回归 因子 :420 个 地 区 (=1,…,420) 的 学 生 一 教师 比 (X,,) 
和 校区 中 英语 学 习 者 的 百分比 (2 )。 根 据 这 个 多 元 回归 模型 所 佑 计 的 OUS 回归 线 为 : 


— T 
TestScore = 686. 0 — 1, 10 x STR - 0. 65 x PagL (5.10) 


这 里 ,PerEL RARP PEJENAUTE. WE) A OLS 估计 值 为 686.0, 学 生 一 教 
MERA ) 的 OLS 估计 值 为 - L. 1, 英语 学 习 者 百分比 系数 ( 房 ) 的 0LS 估计 值 为 
一 心 65. 

在 多 元 回归 中 ,学 生 一 教师 比 的 变化 对 考试 成 绩 的 估计 影响 大 约 相当 于 学 生 -一 教师 比 
是 惟一 回归 因子 时 的 一 半 : 在 单个 回归 因子 的 方程 中 (公式 (5.9) ) ,估计 SIR 每 减少 1 单位 
会 使 考试 成 绩 提高 2. 28 分 ,但 在 多 元 回归 方程 (公式 (3. 10) 中 ,估计 结果 是 只 会 使 考试 成 
绩 提高 1. 10 分 。 发 生 这 种 差异 的 原因 是 ,在 多 元 回 妇 中 ,STR 的 系数 是 在 保持 (或 控制 ) 
PeEL 不 变 时 ,STR 的 变化 所 带 来 的 影响 , 而 在 单个 同 归 因 子 的 回归 中 , Pael 不 是 保持 不 
变 的 。 

下 于 我 们 认为 公式 (5,9) 中 的 单个 回归 因子 模型 的 估计 值 可 能 存在 遗漏 变量 偏差, 因 
此 , 相 比 之 下 ,现在 得 出 的 多 元 回归 的 这 两 个 估计 值 更 为 协调 一 致 。 在 5.1 节 , 我 们 看 到 英 
语 学 习 者 百分比 高 的 地 区 不 仅 倾向 于 有 低 的 考试 成 绩 ,还 有 高 的 学 生 一 教 病 比 。 如 果 回 归 
中 遗漏 了 英语 学 习 者 的 百分比 , 则 我 们 估计 出 的 减少 学 生 一 教师 比 对 考试 成 绩 的 影响 会 更 
大 。 但 是 ,多 元 回归 估计 值 既 反映 了 学 生 一 教师 比 的 变化 对 考试 成 绩 的 影响 ,也 反映 了 曾 被 
我 们 壮 汕 的 地 区 中 有 较 少 英语 学 习 者 对 考试 成 绩 的 影响 。 


重要 概念 5.3 





多 元 回归 模型 中 的 0LS 估计 和 量 、 预 测 值 积 残 束 
OLS WHE Â „Ê Paai 应 是 使 预测 误差 平方 和 六 ( Y 一 b, 一 bX, — b,X,, )° 最 小 的 


ba shi tsb; 的 值 。OLS 预测 值 f MRE # 分 别 为 : 

Ê =Â +B X, + A inln (5.11) 
ú =Y. ,l,i (5.12) 
OLS 估计 量 房 A. 8, TRE u, ERE n TARERE (t ,X,Y 了) isl, 

n 计算 出 来 的 ,它们 也 是 未 知 的 真实 总 体系 数 记 ,8, ,…,B, MEEA u, 的 估计 值 。 
通过 两 种 不 同 的 途径 我 们 得 出 了 同样 的 结论 , 即 在 考试 成 绩 和 学 生 一 教师 比 之 间 的 关 
系 中 存在 遗漏 变量 偏差 ; 将 数据 分 组 的 列表 方法 ( 见 5.1 节 ) 和 多 元 回归 方法 (公式 
(5. 10) ) 。 在 这 两 种 方法 中 ,多 元 回 妇 方法 有 两 个 重要 的 优点 :第 一 , 它 提 供 了 学 生 一 教师 
比 减 少 上 个 单位 对 考试 成 绩 影响 的 定量 估计 值 ,这 是 教育 主管 决策 时 所 需要 的 ;第 二 , 它 易 





间 变 化 。 如 果 除 了 STR, 和 PerEL, 之 外 ,变量 FraeEL, 被 作为 第 三 个 回归 因子 包含 进来 , 那 
公 回 归 因 子 将 会 中 完全 多 重 共 线 的 ,因为 Pet 三 是 英语 学 习 者 百分比 。 因 此 ,对 于 每 个 地 
区 ,有 PetEL, = 100 x FrackL 这样, 一 个 回归 因子 {PetEL) 可 被 表示 成 男 一 -个 回归 央 子 
( FracEL, ) 的 精确 的 线性 冰 数 。 

由 于 存在 这 种 完全 多 重 共 线 性 ,因此 ,计算 TesiScore, 对 STR, ,PetEL 和 FracEL, 的 回归 
的 OLS 估计 值 是 不 可 能 的 。 不 同 的 软件 包 对 完全 多 重 共 线 性 的 处 理 方式 不 同 。 如 果 你 试 
图 佑 计 这 个 回归 ,那么 软件 将 会 输出 下 面 三 个 结果 中 的 一 个 : 它 会 蓟 除 一 个 变量 {任意 地 选 
择 一 个 日 除 ) ; 它 会 拒绝 计算 OLS 估计 值 并 给 出 错误 信息 ;或 者 死机 。 之 所 以 会 这 样 的 数学 
原因 是 ,多 重 共 线 性 在 OLS 公式 中 产生 了 0 除数 的 情况 。 

直观 上 ,完全 多 重 共 线 性 之 所 以 是 个 难题 的 原因 在 于 你 总 是 用 回归 去 解 管 -- 个 不 合 逐 
辑 的 问题 。 同 想 一 下 ,PetEL 的 系数 是 在 保持 其 他 变量 不 变 的 条 件 下 ,PetEi 的 单位 变化 对 
考试 成 绩 的 影响 。 如 果 其 他 变量 之 一 是 FracBi ,那么 在 保持 英语 学 习 者 比例 不 变 的 条 件 下 ， 
英语 学 习 者 百分比 的 单位 变化 的 影响 是 什么 ? 由 于 在 精确 的 线性 关系 中 ,英语 学 习 者 的 百 
分 比 和 英语 学 习 省 的 比例 一 起 变动 ,因此 这 个 问题 没有 意义 , OLS 也 不 能 解答 这 个 问题 。 

例 2:“ 不 太 小 "的 是 级 。 设 NVS, 是 个 二 元 变量 ,如 果 第 i 个 地 区 学 生 一 教师 比 是 “不 太 
小 "的 ,那么 它 等 于 1。 具 体 来 说 , 若 STR 212 WJ NVS, 等 于 1; 否 则 ,NYS, 等 于 0。 这 个 同 归 
也 表现 出 完全 多 重 共 线 性 ,但 这 却 是 因为 一 个 比 前面 例 子 中 的 回归 更 微妙 的 原因 。 事 实 上 ， 
在 我 们 这 个 数据 集中 ,没有 STR, <12 的 地 区 ,如 在 图 4 一 2 的 散 点 图 中 可 以 看 到 ,STR 的 最 
小 值 是 14。 因 此 ,对 于 所 有 的 观察 值 ,有 和 人 ,=1。 回 想 一 下 ,含有 裁 距 的 线性 回归 模型 可 
被 等 价 地 看 敌 是 包含 一 个 对 于 所 有 的 都 等 于 1 的 回归 因子 ,如 公式 (5.6) 所 示 。 因 此 ， 
对 于 数据 集中 的 所 有 观察 值 ,我 们 可 以 写 为 NYS, =1 x X, ,也 就 是 说 ,可 以 将 NVS, 写 为 回归 
因子 的 精确 的 线性 组 合 , 具 体 来 说 , 它 等 于 总。 

这 个 例子 前 明了 多 重 共 线 性 的 两 个 要 点 。 第 一 , 当 回归 方程 中 包含 截 虐 时 ,那么 可 能 涉 
及 完全 多 重 共 线 性 的 回归 因子 之 一 是 “常数 "回归 因子 XX。 第 二 ,完全 多 重 共 线 性 是 对 你 
所 掌握 的 数据 集 的 一 种 陈述 。 虽 然 想象 一 个 少子 12 名 学 生 一 教师 比 的 学 区 是 可 能 的 ,但 是 
在 我 们 的 数据 集中 不 存在 这 样 的 学 区 ,所 以 我 们 不 能 在 回归 中 分 析 它 们 。 

例 3: 说 英语 的 大 的 百分比 。 设 Paes, 为 第 个 地 区 说 英语 的 人 的 百分比 ,也 可 定义 为 
不 学 习 英 语 的 学 生 的 百分比 ,回归 因子 仍 是 完全 多 重 共 线 的 。 像 前 面 的 例子 一 样 ,回归 因子 
之 间 精 确 的 线 福 关系 涉及 “常数 ”回归 因子 和 :对 于 每 个 地 区 ,都 有 PerES, = 100 x X, — 
PatEL,, 

这 个 例子 说 明了 另 一 点 :完全 多 重 共 线性 是 回归 因子 整体 集合 的 特征 。 如 果 从 这 个 回 
妇 模 弄 中 排除 掉 截 距 { 即 回归 因子 蕊 , ) 或 Po EL ,那么 回 妇 因子 不 会 是 完全 多 重 共 线 的 。 

完全 多 重 其 线性 的 解决 方法 。 如 果 设 定 回归 模型 时 犯 了 错误 ,就 会 出 现 完 全 多 重 共 线 
性 。 有 时 这 种 错误 是 容易 发 现 的 (如 在 第 一 个 合子 中 ) ,但 有 时 就 不 容易 发 现 了 (如 在 第 二 
个 例子 中 ) 。 如 果 你 犯 了 此 类 错误 ,那么 软件 包 会 以 某 种 方式 让 你 知道 ,因为 你 犯 了 这 样 的 
错误 即 存在 完全 多 重 共 线性 时 ,软件 是 无 法 计算 OLS 佑 计量 的 。 


重要 概念 5.4 





多 元 回归 模型 的 最 小 二 先 假 设 


Y =P +B XR + FAX. tu il, n 


L PE X, Xa, X. RIET yu, 的 条 件 均值 为 0, 即 E(u,1X,, Xa, X.) =0; 


2. (1,n, 是 取 自 于 它们 的 联合 分 布 的 独立 同 分 布 (ii.d ) 的 
样本 ; 

3 (Xita su) 具有 非 零 的 有 有限 的 四 阶 甜 ; 

4. 不 存在 完全 多 重 共 线 人 性。 

当 软 件 告诉 你 在 你 的 模型 中 存在 多 重 共 线 性 时 ,最 为 重要 的 事情 是 你 需要 对 回归 模型 
进行 修正 ,以 消除 多 重 共 线性 。 当 存在 完全 多 重 共 线 性 时 ,有 些 软件 是 不 可 靠 的 。 如 果 同 归 
因子 是 完全 多 重 共 线 的 ,那么 至 少 你 可 以 把 对 回归 因子 选择 的 控制 权 让 给 计算 机 。 

不 下 全 多 平 具 续 片 。 尽 管 名 称 相似 ,但 不 完全 多 重 共 线 性 在 概念 上 与 完全 多 重 共 线 件 
完全 不 同 。 不 完全 多 重 共 线性 {imperfect multicollinearity) 意味 着 两 个 或 多 个 回归 因子 是 
高 度 相关 的 ,在 此 意义 下 存在 一 个 与 另 一 个 回归 因子 高 度 相关 的 回归 因子 的 线性 函数 。 厅 
完全 多 重 共 线性 不 会 给 OLS 估计 量 造 成 任何 问题 。 事 实 上 , 当 这 些 回 归 因 子 潜 在 相关 时 ， 
OLS 估计 量 的 目的 就 是 挑选 出 不 同 回归 因子 的 独立 影响 。 

多 元 辑 归 模型 的 最 小 二 乘 假设 在 重要 概念 5.4 中 总 结 。 


[3.5 _ 多 元 回归 中 OLS 估计 量 的 分 布 - 


由 于 数据 因 样 本 不 同 而 不 同 , 因 此 不 同 的 样本 会 产生 不 同 的 OLS 估计 量 的 值 。 对 总 体 
回归 系数 BB ,B,,…,B, 的 OLS 估计 量 来 说 ,它们 的 值 在 各 种 可 能 的 样本 间 变 化 , 便 产生 了 人知 
计量 值 的 不 确定 性 。 正 如 一 元 回归 一 样 ,这 种 变化 被 归纳 在 OLS 估计 量 的 抽样 分 布 中 。 

回想 一 下 4.4 节 的 内 容 ,在 最 小 二 乘 假 设 下 ,一 元 线性 回归 模型 中 的 OLS 估计 量 ( 记 和 
ÊD EKHAR G 和 有 ) 无 偏 的 一致 的 估计 量 。 此 外 ,在 大 样本 条 件 下 , 记 和 启 的 抽样 分 
布 可 被 二 元 正 态 分 布 很 好 地 逼近 。 

这 些 结 论 可 直接 沿用 到 多 元 回归 分 析 中 。 也 就 是 说 ,在 重要 概念 5.4 中 的 最 小 二 乘 假 
设 下 ,多 元 线性 回归 模型 中 OLS 估计 重启 ,BB,，… AO EB. B... 8, 无 偏 的 ,一 致 的 估计 量 。 
在 大 样本 条 件 下 Â A... A, 的 联合 抽样 分 布 被 多 元 正 态 分 布 很 好 地 得 近 , 多 元 正 态 分 布 
是 从 二 元 正 态 分 布 到 两 个 或 两 个 以 上 的 联合 正 态 随机 变量 分 布 ( 见 2.4 节 ) 的 推广 。 

尽管 当 存 在 多 个 回归 因子 时 ,代数 运算 比较 复杂 ,但 是 中 心 极限 定理 也 适用 于 多 元 回归 
模型 中 的 OLS 估计 量 , 就 像 它 适用 于 了 和 和 通用 于 存在 一 个 回归 因子 时 OLS 佑 计量 的 道理 一 
样 :OLS 合计 量 高 ,名 ，…, 记 ,是 随机 样本 数据 的 平均 值 ,如 果 样本 足够 大 ,那些 平均 值 的 机 
样 分 布 则 服从 正 态 分 布 。 由 于 在 数学 上 多 元 正 态 分 布 用 矩阵 代数 最 好 处 理 , 因 此 ,OILS 估计 
量 联合 分 布 的 表达 式 推迟 到 第 16 章 介绍 。 

重要 概念 5. 5 总 结 了 这 样 的 结果 , 即 在 大 样本 条 件 下 ,多 元 回归 中 0LS 估计 量 的 分 布 
渐 近 地 服从 联合 正 态 分 布 。 一 般 来 讲 ,OLS 估计 量 之 间 是 相关 的 ,这 种 相关 性 是 由 回归 因子 
之 间 的 相关 性 引起 的 。 对 于 有 两 个 回归 因子 和 同方 差 误差 的 情况 ,OLS 估计 量 的 联合 抽样 
分 布 在 附录 S. 2 中 进行 了 详细 的 讨论 ,而 更 一 般 的 情况 在 16. 2 节 中 讨论 。 


OLS 估计 其 的 标准 识 
回想 一 下 ,在 一 元 回归 的 情况 下 ,用 样本 均值 代 关 期 望 值 来 估计 OLS 估计 量 的 方差 是 
可 能 的 ,这 就 导出 了 公式 (4. 19) 中 给 出 的 估计 量 22 。 在 最 小 二 乘 假设 下 ,大 数 定律 的 结论 











隐 舍 着 ,这 些 样本 均值 收 伍 于 其 总 体 均值 .例如 ¿b o) ->1。 全 的 平方 根 就 是 房 的 标准 
i SECA) ,也 即 房 的 抽样 分 布 标准 差 的 一 个 估计 量 。 

所 有 这 些 都 可 直接 扩展 到 多 元 回归 。 第 j 个 回归 系数 的 OLS 估计 量 房 有 个 标准 差 ,这 
个 标准 差 是 用 它 的 标准 误 SB( 启 ) 估计 的 。 标 准 误 的 公式 使 用 矩阵 最 容易 说 明 , 所 以 它 在 
16. 2 节 中 给 出 。 重 要 的 一 点 是 ,就 标准 误 来 说 ,单个 和 多 个 回归 因子 的 情况 之 间 在 概念 上 
不 存在 差异 ,最 为 关键 的 思想 一 一 估计 量 的 大 样本 正 态 人 性 和 一 致 地 估计 其 抽样 分 布 标准 差 
的 能 力 一 一 是 完全 相同 的 ,不 论 模型 中 有 1 个 .2 个 还 是 有 12 个 回归 因子 。 


重要 概念 5.5 
ñ, É... Ë, 的 大 样本 分 布 
如 果 最 小 二 乘 假设 ( 见 重要 概念 5.4}) 成 立 , 那 么 大 样本 中 OL FH R A, A... ñ, IE 
从 联合 正太 分布, 每 个 应 服从 分 布 W(B ,aa?) J =0,. k, 


[5.6 单个 系数 的 假设 检验 和 置信 区 间 
本 节 描 述 如 何 检验 多 元 回归 方程 中 关于 单个 系数 的 候 设 和 如 何 构造 其 置信 区 间 。 


5.6.1 单个 系数 的 假设 检验 


假定 保持 校区 中 英语 学 习 者 的 百分比 不 变 ,现在 你 想 要 检验 "学 生 一 教师 比 的 变化 对 
考试 成 绩 没 有 影响 "这 个 假设 。 这 相当 于 假设 ,在 考试 成 绩 对 STR 和 PeEl 的 总 体 回归 中 ， 
“学 生 一 教师 比 的 真实 系数 为 零 "。 更 一 般 地 说 ,我 们 可 能 想 要 检验 第 j 个 回归 因子 的 真 
KRAS 取 某 个 特定 信 8, 的 假设 。 这 个 零 假设 值 要 么 来 自 于 经 济 理论 ,要 么 和 学 生 一 教 
师 比 的 例子 一 样 , 来 自 于 应 用 中 的 决策 背景 。 如 果 备 择 假设 是 双边 的 ,那么 这 两 个 假设 在 数 
学 上 可 写成 ; 





H, B, =B. H :B 8 ol 双边 备 择 假 设 ) (5.13) 

pia, ins — HHR E STR ,那么 改变 学 生 一 教师 比 对 考试 成 绩 没 有 影响 的 零 假设 对 
WFB =0 的 零 假设 (因此 Bo。=0)。 我 们 的 任务 就 是 朋 样 本 数据 在 备 择 假 设 H. TREF 
假设 总 。 

当 存在 单个 回归 因子 时 ,重要 概念 4.6 纵 出 了 检验 这 个 零 假设 的 程序 。 该 程序 的 第 一 
步 是 要 计算 该 系数 的 标准 误 。 第 二 步 是 用 重要 概念 4.5 中 的 一 般 公式 计算 :统计 量 。 第 三 
步 是 用 附 表 ! 中 的 累积 正 态 分 布 计算 检 验 的 p 值 ,或 者 比较 :统计 量 与 对 应 的 检验 想 要 的 
显著 性 水 平 的 临界 值 。 这 个 程序 的 理论 基础 是 OLS 估计 量 有 大 样本 正 态 分 布 ,在 零 假设 
下 ,其 均值 为 假设 真实 值 ,分 布 的 方差 可 被 一 致 邮 估计 出 来 。 

这 个 基础 也 存在 于 多 元 回归 中 。 如 重要 概念 5.5 ARÁ 的 抽样 分 布 是 渐 近 正 态 的 。 
在 零 假 设 下 ,此 分 布 的 均值 为 p 。, 这 个 分 布 的 方差 能 被 一 致 地 个 计 出 来 。 因 此 ,我 们 可 以 
简单 地 遵循 与 单个 回归 因子 情况 下 相同 的 程序 来 检验 表达 式 (5. 13) 中 的 零 假设 。 

检验 多 元 回归 中 单个 系数 假设 的 程序 ,在 重要 概念 5.6 中 总 结 。 在 这 个 重要 概念 中 , 实 
际 计 算 的 + 统计 晤 表示 为 1”, 然而 ,习惯 上 将 它 简 记 为 ,本 书 以 下 部 分 中 ,我 们 采 甩 这 个 简 
化 的 符号 。 








5.6.2 单个 系数 的 置信 区 间 


多 元 回归 模型 中 构造 置信 区 闻 的 方法 也 和 单个 加 好 因子 模 型 中 的 一 样 。 这 个 方法 已 在 
重要 概念 5. 7 中 总 结 。 
重要 概念 5.6 中 构造 假设 检验 的 方法 和 重要 概念 5.7 中 构造 置信 区 间 的 方法 ,依赖 于 


OLS 估计 量 饭 分 布 的 大 样本 正 态 近 似 。 因 此 ,应 当 牢 记 , 这 些 量化 抽样 不 确定 性 的 方法 只 
有 在 大 样本 条 件 下 才能 确保 有 效 。 


重要 概念 5. 6 
PHRIS, =B,o HARRIT E fo 
1 计算 房 的 标准 误 SE( 甩 )。/ 


2. 计算 上 统计 量 : 
TB -Be l (5.14) 
SE(B,) 
3. 计算 p 值 ; 
p iñ =26( - 21) (5.15) 


其 中 ,过 是 实际 计算 的 上 统计 量 的 值 。 如 果 ? 值 小 于 0.05 ,或 者 说 ,如 果 1 志 1 >1.%6, 那 么 在 
5% 的 显著 水 平 下 拒绝 零 假 设 。 
检验 =0 的 标准 误 ,特别 是 :统计 重 和 p 值 ,可 由 回归 软件 自动 计算 出 来 。 


5. 6.3 在 考试 成 绩 和 学 生 一 教师 比 案例 中 的 应 用 


一 旦 我 们 控制 了 地 区 中 英语 学 习 者 的 百分比 ,我 们 能 拒绝 学 生 一 教师 比 的 变化 对 考试 
成 绩 没有 影响 的 零 假 设 吗 ? 控制 英语 学 习 者 的 百分比 后 ,学 生 一 教师 比 的 变化 对 考试 成 绩 
影响 的 5% 的 质 信 区 间 是 什么 ?我 们 现在 能 够 得 出 结论 。 由 OLS 估计 出 的 考试 成 绩 对 
STR 和 PetkEL 的 回归 方程 在 公式 (5.10) 中 给 出 ,这 里 我 们 把 它 重 写 出 来 ,标准 误 在 系数 下 面 
的 插 导 里 给 出 。 


— n 
TestScore = 686.0 - 1.10 xSTR- 0.650 x PetEL (5.16) 
(8.7) (0.43) (0.031) 


为 了 检验 STR 的 真实 系数 为 0 的 假设 ,我 们 首先 需要 计算 公式 (5. 14) 中 的 上 统计 量 。 
因为 零 假设 假定 这 个 系数 的 真实 值 为 0, 所 以 :统计 量 是 :=( -1.10 -0)/0.43 = -之 54。 
相应 地 ,p 值 为 2B( -2.54) =1.1%, 也 就 是 说 ,我 们 能 够 护 绝 零 假设 的 最 小 蝇 著 性 水 平 为 
1.1 够 。 由 于 P 值 小 于 $ 锡 ,因此 在 5 名 的 显著 性 水 平 下 能 够 拒 忽 零 假设 (但 在 1% 的 显著 性 
水 平 下 却 不 一 定 能 拒绝 )。 

STR 总 体系 数 的 95 名 的 置信 区 间 为 - 1. 10 +1.96 x0.43 = ( -1.95, — 0.26) ,也 就 是 
说 ,我 们 有 95 铝 的 把 握 相 信 系数 的 真实 值 介 于 - 1.95 和 -0.26 之 间 。 对 教育 主管 所 感 兴 
趣 的 将 学 生 一 教师 比 减少 2 个 单位 这 一 问题 面 言 ,这 个 减少 对 考试 成 绩 影 响 的 95% 的 置信 
区 局 为 ( -1.95 x2,-0.26x2)=(-3.9,-0.52)。 


重要 概念 5. 7 


多 元 回归 中 单个 系数 揭 填 信 区 间 
系数 有 的 95% 的 双边 置信 区 间 , 是 指 在 5% 的 概率 保证 下 ,包含 B, 的 真实 值 的 区 间 ， 








也 就 是 说 ,在 所 有 可 能 殖 机 抽取 的 样本 中 ,有 95% 0553 8 的 真实 值 落 于 其 中 ,或 者 说 , 它 
也 是 不 能 被 5 名 的 双边 假设 检验 所 拒绝 的 及 的 值 的 集合 。 当 样本 容量 很 大 时 ,95% 的 置信 
KEE: 
B, 9) 95% MEREN] = (8 - 1. 96SE(B.) Â +1. 96SE(B)) (5.17) 

用 1. 645 REAS. 17) 中 的 1.96 就 可 以 得 到 90% 的 置信 区 间 。 

Ruh eee ARAR D rr 根据 公式 (5.16) 中 的 多 元 回归 分 析 结 果 , 已 经 可 以 
说 服 该 教育 主管 , 即 根据 当前 所 有 的 证 据 ,在 其 所 属 的 地 区 减 小 班级 规模 将 会 对 提高 考试 成 
绩 有 所 帮助 ,但 是 ,现在 她 转向 了 一 个 更 加 细微 的 问题 。 如 果 她 想 要 雇佣 更 多 的 教师 ,她 可 
以 通过 削减 预 算 的 其 他 方面 (如 不 配置 新 的 电脑 ,减少 维护 费用 等 ) ,或 者 要 求 增加 她 的 财 
政 预 算 来 支付 那些 教师 的 工资 ,而 纳税 人 不 喜欢 这 样 。 她 会 癌 ,在 保持 每 个 学 生 的 费用 (和 
英语 学 习 者 的 百分比 ) 不 变 的 情况 下 ,减少 学 生 一 教 鳞 比 对 考试 成 绩 的 影响 是 什么 ? 

这 个 问题 可 以 通过 估计 考试 成 绩 对 学 生 一 教师 比 .每 个 学 生 的 总 费用 和 英语 学 习 者 的 
百分比 的 阿 归 来 解决 。OLS 回归 线 为 : 


— 
TestSeore = 649,6 - 0.29 xSTR+ 3. 87 x Exp- 0.656 x PctEL (5.18) 
(15.5) (0.48) (1.59) (0. 032) 


其 中 ,Expn 是 以 干 美元 表示 的 地 区 中 每 个 学 生 的 年 度 总 费用 。 
结果 是 惊人 的 。 在 保持 每 个 学 生 的 费用 和 英语 学 习 者 的 百分比 不 变 的 情况 下 ,改变 学 
生 一 教师 比 对 考试 成 绩 的 影响 非常 小 ;公式 (5.16) 中 STR 的 合计 系数 为 -1.10, 但 是 在 公 
式 (5.18) 中 增加 了 Eam 作为 回归 因子 后 ,这 个 估计 系数 仅 为 -0. 29。 此 外 ,检验 该 系数 的 
真实 值 为 零 的 :统计 量 现 在 是 1:=( -0.29-0)/0.48 = -0.60, 所 以 ,这 个 系数 的 总 体 值 确 
实 为 零 的 假设 不 能 被 拒绝 ,即使 在 10% 的 显著 性 水 平 下 (1 一 0.601<1.645) 也 不 能 被 拒绝 、 
因此 ,如 果 每 个 学 生 的 总 费用 保持 不 变 , 那 么 ,公式 (5. 18) 没 有 为 雇 代 更 多 的 教师 会 提高 考 
试 成 绩 提供 任何 证 据 。 

注意 , 当 Expn 变量 被 添加 进来 后 ,57R 的 标准 误 从 公式 (5.16) 中 的 0.43 增加 到 公式 
《5.18) 中 的 0.48。 这 说 明了 一 个 要 点 , 即 回归 因子 之 间 的 相关 性 ( STR 和 Expr 之 间 的 相关 
系数 为 -0. 62) 会 使 OLS 估计 量变 得 更 不 精确 (进一步 讨论 见 附录 5. 2)。 

我 们 那些 愤怒 的 纳税 人 会 怎么 样 呢 ? 他 们 断言 学 生 一 教师 比 系数 (8 ) 和 每 个 学 生 的 
费用 系数 (B,) 的 总 体 值 都 是 零 , 也 就 是 说 ,他 们 假设 B, =0 和 B=0。 尽 管 看 起 来 我 们 好 像 
能 够 拒绝 这 个 假设 ,因为 公式 (5. 18) 中 检验 8, =0 的 :统计 量 为 :=3.87/1.59 =2.43, 但 是 
这 个 推理 有 缺陷 。 纳 税 人 的 假设 是 一 个 联 会 假设 ,要 检验 这 个 假设 ,我们 需要 一 个 新 的 工具 
一 一 F 统计 量 。 


57 联合 假设 的 检验 - 
本 节 介绍 如 何 对 多 元 加 归 系 数 微 联合 假设 ,以 及 如 何 用 F 统计 量 对 它们 进行 检验 。 


5.7,1 检验 两 个 或 多 个 系数 的 假设 


联合 零 般 设 ”考虑 公式 {5.18) 中 考试 成 绩 对 学 生 一 教师 比 、 每 个 学 生 的 费用 和 英语 学 
习 者 百分比 这 三 个 变量 的 回归 。 我 们 愤 奴 的 纳税 人 假设 ,一 旦 我 们 控制 了 英语 学 习 者 的 百 
分 比 , 学 生 一 教师 比 和 每 个 学 生 的 费用 对 考试 成 绩 都 没有 影响 。 由 于 STR 是 公式 (5. 18) 中 

















5.7.2 正统 计量 


Fiti F statlstic) 用 来 检验 关于 回归 系数 的 联合 假设 。 下 统计 量 的 公式 已 被 震 人 
到 现代 回归 分 析 软 件 中 。 我 们 首先 讨论 两 个 约束 条 件 的 情形 ,然后 再 转向 q 个 约束 条 件 的 
一 般 情形 。 

含有 4 =2 个 约束 条 件 的 天 统计 县， 当 联 合 零 假设 含有 两 个 约束 条 件 B =0 和 8B, =0 
时 ,下 统计 基 用 下 面 的 公式 将 t 统 计量 和 4 结合 在 一 起 : 

_ 1 5 tü -puntit 
r UT) 

其 中 ,p, ,是 两 个 上 统计 量 之 间 相 关系 数 的 佑 计量 。 

为 了 理解 公式 (5. 21) 中 的 下 统计 鞭 , 首 先 假设 我 们 知道 :1 统 订 量 是 不 相关 的 ,因此 我 们 


就 可 以 委 掉 与 8 相关 的 项 。 如 果 是 这 样 的 话 ,公式 (5. 21) 就 可 简化 为 严 = 二 ( 吕 + 妃 ) H 


下 统计 量 是 上 统计 量 的 平方 和 的 平均 值 。 在 零 根 设 下 ,5 和 tt 是 相互 独立 的 标准 正 态 随机 
变量 (根据 假设 ,t 统计 量 是 不 相关 的 ) ,所 以 在 零 假 设 下 ,下 服从 F, . yd ( 2.4 5). Æ 
备 笃 假 设 要么 Bi 不 为 零 ,要 么 B, 不 为 党 (或 者 两 者 都 不 为 汐 ) 的 条 件 下 ,如 或 5( 或 二 者 ) 将 
会 很 大 ,这 将 会 导致 检验 结果 是 拒绝 堂 假设 。 

一 般 来 讲 ,: 统 计量 是 相关 的 ,公式 (5.21) 中 已 统计 量 的 会 式 就 是 对 这 个 相关 性 进行 了 
调整 。 进 行 这 样 调整 的 目的 是 ,在 零 假 设 下 ,不 论 ! 统 计量 是 否 相 关 , 玉 统计 量 定 大 样本 条 
件 下 都 服从 下 分布。 

含有 vy 个 约束 条 件 的 下 统计 世 。 检验 表达 式 (5. 20) 中 9 个 约束 条件 的 联合 零 假设 的 下 
统计 量 的 公式 夺 16. 3 节 中 给 出 。 这 个 公式 已 被 杠 人 到 回归 分 析 软 件 中 ,使 得 下 统计 量 在 实 
际 中 易于 计算 。 

在 零 假设 下 ,F 统计 量具 有 抽样 分 布 , 其 抽样 分 布 在 大 样本 条 件 下 是 由 F, , 的 分 布 给 出 
的 。 也 就 是 说 ,在 大 样本 中 ,在 零 假设 下 有 : 

玉 统 计量 服从 分 布 F... {5. 22) 

因此 ,对 于 适当 的 4 值 和 想 于 的 显著 性 水 平 , 忆 统计 量 的 临界 值 可 以 从 附 表 4 中 的 F a 
分 布 中 得 到 。 

HA Ft EIA p Ë. F 统计 量 的 p 值 ,可 以 使 用 其 分 布 的 大 样本 x 近似 计算 出 
来 。 设 Ff” 为 实际 计算 的 下 统计 量 的 值 ,由 于 在 零 假设 下 下 统计 量 服从 大 样本 的 F. J Yin, 
因此 p 值 为 : 


(5.21) 


pE = Pr(F,, > F°) (5.23) 
公式 (5.23) 中 的 p 值 可 以 使 用 已 Fir (sy Asa AA 分 布 的 随机 变量 是 
F, .分 布 的 随机 变量 的 4 倍 ) 来 求 值 。 另 一 种 可 供 选 择 的 方法 是 ,使 用 计算 机 来 求 p fŠ , A 

为 累积 卡 方 分 布 和 下 分 布 的 公式 已 被 谋 人 到 最 新 的 统计 软件 中 了 。 
“全 体 "回归 的 严 统 计量 -“ 全 体 " 回归 的 到 统计 量 检 验 所 有 全 率 系数 都 为 零 的 联合 假 

设 , 即 零 假设 和 备 择 假设 是 : 

羽 沁 =08 =0,…,B =0 与 只 :局 #0, 至 少 有 一 个 Kj=1,…,&) (5.24) 
EXIRET, Ar FPI 338 T Y 中 的 任何 变 差 ,尽管 截 距 ( 在 零 假 设 下 它 
是 了 的 均值 ) 可 能 是 非 零 的 。 表 达 式 (5. 24) 中 的 零 假设 是 表达 式 (5. 20) 中 一 般 零 假设 的 
特殊 情形 , 且 全 体 问 妇 的 下 统计 量 基 在 表达 式 (5. 24) 中 对 霍 假设 计算 的 卫 统 计量 。 在 大 样 


本 条 件 下 ,全 体 回 归 的 下 统计 量 服从 下 ,的 分 布 。 

"qq =l 时 的 F 统 计生 2395 q =1 时 ,统计 量 检验 一 个 约束 条 件 。 于 是 ,联合 零 很 设 变 
成 了 单个 回归 系数 的 零 假 设 , 统计 量 是 :统计 基 的 平方 。 

只 方 其 各 同 太 类 .回想 一 下 4.9 节 , 由 于 历史 原因 ,统计 软件 有 时 将 仅 适 用 于 同方 差 的 
标准 误 作 为 默认 值 计算 ,因此 ,要 计算 异 方差 稳健 的 标准 误 , 用 户 必须 自己 设 定 。 这 个 提醒 
也 适用 于 F 统 计量 :为 了 确保 你 使 用 异 方差 稳健 的 下 统计 量 ,在 有 些 回归 软件 包 中 ,你 必须 
选择 “稳健 的 ”选项 ,使 用 “ 协 方差 阵 " 的 稳健 估计 值 。 如 果 使 用 正统 计量 的 仅 适 用 于 同方 差 
的 形式 (在 附录 5.3 中 讨论 ) ,但 误差 是 异 方差 的 ,那么 在 零 假设 下 ,下 统 计量 不 会 服从 表达 
式 (5.22) 中 的 下, 分 布 ,这 会 导致 令 上 误解 的 统计 推断 。 


5.7.3 在 考试 成 绩 和 学 生 一 教师 比 案例 中 的 应 用 


我 们 现在 可 以 检验 下 面 的 零 假 设 和 备 择 狠 设 。 零 假设 是 :学 生 一 教师 比 的 系数 和 平均 
每 个 学 生 的 费用 系数 均 为 零 。 备 择 假设 是 ;它们 之 中 至 少 有 一 个 不 为 替 。 同 时 要 控制 该 地 
区 内 英语 学 习 者 的 百分比 。 

为 了 检验 这 个 假设 ,我 们 需要 用 公式 (5. 18) 中 的 考试 成 绩 对 STR Erp PaEL 的 回归 
来 计算 检验 8, =0 MA =0 的 下 统计 量 。 这 个 卫 统 计量 为 5.43。 在 零 假设 下 ,这 个 统计 量 
在 大 样本 条 件 下 服从 F, . 分布。 五, 分布 的 5 名 的 临界 值 为 3. 00( 见 附 表 4) ,1% 的 临界 值 
为 4 61。 根 据 数据 所 计算 的 王 统 计量 的 值 为 5. 43 ,超过 了 椒 虹 ,所 以 零 假 设 在 1% 的 显著 
性 水 平 下 被 拒绝 。 如 果 零 假设 确实 是 真 的 ,那么 我 们 抽 到 一 个 会 得 出 和 5. 43 一 样 大 的 下 统 
计量 的 样本 是 非常 不 可 能 的 {p 值 为 0. 005) 。 根 据 公式 (5. 18) 中 的 证 据 以 及 这 个 下 统计 量 
所 总 结 的 信息 ,在 保持 英语 学 习 者 的 百分比 不 变 的 条 件 下 ,我 们 可 以 拒绝 纳税 人 提出 的 “学 
生 一 教师 比 及 平均 每 个 学 生 的 费用 对 考试 成 绩 都 没有 影响 ”的 假设 。 





[5.8_ 检验 涉 及 多 个 系数 的 单个 约束 条 件 ， 


有 时 经 济 理论 会 提出 涉及 两 个 或 多 个 回归 系数 的 单个 约束 条 件 。 例 如 , 理论 可 能 会 提 
H—+ B, =p, 形式 的 零 假设 , 即 第 一 个 和 第 二 个 回归 因子 的 影响 是 相同 的 。 在 这 种 情况 
下 ,我 们 的 任务 就 是 检验 两 个 系数 相同 的 零 假 设 和 商 个 系数 不 同 的 备 择 候 设 , 即 ， 

H, 8, =B: 5 H, :B, >B, (5.25) 

这 个 零 假设 有 一 个 约束 条 件 , 所 以 9=1, 但 这 个 约束 条 件 涉及 多 个 系数 (8, Me). R 
们 需要 修正 现存 的 方法 来 检验 这 个 假设 。 有 两 种 方法 , 哪 一 种 方法 最 容易 取决 于 你 所 用 的 
软件 。 

方法 ! :直接 检验 约束 。 某 些 统计 软件 包含 有 某 个 专门 的 设计 命令 来 检验 像 表 达 式 
(5.25) 那 样 的 约束 条 件 ,其 结果 是 一 个 了 统计 量 , 由 子 9=1, 所 以 在 零 假设 下 该 统计 量 服 从 
六 .分布 。( 回想 一 下 2. 4 节 , 一 个 标准 正 态 随机 变量 的 平方 服从 F e rip BEA F... yf 
É) 95% J A Jy lui 1.962 =3.84.) 

方法 2: 变换 回归 形式 。 如 果 你 的 统计 软件 包 不 能 直接 检验 约束 条 件 ,那么 可 以 将 原来 
的 回归 方程 重 写 一 下 ,以 把 表达 式 (5. 25) 中 的 约束 条 件 变换 为 一 个 单个 回归 系数 的 约束 条 
件 , 用 这 样 的 技巧 来 检验 表达 式 (5. 25 ) 中 的 假设 。 上 基体 来 说 ,假设 回归 中 只 有 两 个 回 与 因 


子 计 ,和 ,所 以 总 体 和 回归 方程 的 形式 为 ; 
Y. =f, +B An +B,X, +u, (5.26) 





英语 学 习 者 的 百 分 出 下 变 的 情况 下 ,学 生 一 教师 比 和 平均 每 个 学 生 焊 用 系 琢 的 一 个 95% Ú 
图 信和 集 [ 置信 椭 回 )}。 这 个 权 国 不 包 桥 (0,0) 点 ,这 意味 着 利用 户 统 计量 ,这 两 个 系 带 都 为 学 
的 零 假 机 在 3 名 的 显著 性 水 平 下 害 指 绝 了 ,这 一 点 在 朱 7 Wira ea T. WGM 
加 认 个 用 的 香 跌 , 香 杨 的 两 山 分 别 指向 丰 下 广 和 右上 方 。 这 种 指向 的 原因 是 ,所 估计 的 馈 
和 矶 之 癌 的 相关 系数 是 正 的 , 它 昆 由 回归 因子 SR BI Exon 之 癌 的 负 相 关 所 引起 的 征 店 学 
生 的 花费 越 志 的 学 校 倾向 于 有 更 低 的 学 生 一 救 师 比 )， 

B: 
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图 5 一 1 p, 各 的 的 名 的 古寺 和 
5, 10 ”其 他 一 些 回归 统计 量 - 
李 元 回归 中 三 个 带 用 的 鳍 过 性 统计 基 是 ;回归 前 标准 误 ; 回 归 的 R° 和 调整 的 不 (也 称 
HE ,这 三 个 弹 计 量 都 油库 耳 参 元 回归 线 的 OLB 司 计 值 描述 或 " 报 合 " 几 据 的 好 坏 各 庶 ， 


5.10.1 回归 的 标准 误 ( SER) 


MIRAE TREN u, 的 标 礁 着 。 因 此 ,SER -E Y BS Ele shi hum i 
EN- AE ESEA SER 是 ， 


T as 1 pa W 
SER =p MPa = 一 和 二 Z e E (3.28) 





这 里 ,SS 是 玻 莽 平方 和 ,S35R Èi, 

表达 式 (5.28) 中 的 定义 和 牛 8 节 中 单个 回 时 因 于 模型 中 SEA 的 定义 之 间 的 惟一 差异 
基 , 这 里 的 除数 是 n -上 -1 而 不 是 a-2。 在 48 节 中 ,除数 mn-2( 不 是 a) 调整 了 由 估计 两 
趟 系数 {回归线 的 笑 率 和 截 距 ) 所 引信 的 向 下 偏 莽 。 这 电 , 除 数 a- 上 -1 调整 了 由 居 计 和 +1 
个 系数 (上 个 斜率 系数 如 上 和 截 工 } 所 引信 的 向 下 候 基 。 与 4 节 中 一 样 ,使 用 一 和 -1 而 不 
使 用 被 称 为 自由 雇 油 整 。 和 如 昌 具 有 单个 回 妥 因 子 ,那么 =1, 因 此 相 昌 节 中 的 公式 和 囊 
ERU 强 ) 中 的 公式 相同 。 当 很 大 时 ,自由 谋 油 整 的 影响 是 可 以 忽略 的 。 











5.10.2 R° 


回归 的 及 是 被 回归 因子 所 解释 (或 所 预测 ) 的 了 的 样本 方差 的 部 分 ,或 者 说 , 产 是 : 
减 去 没有 被 回归 因子 所 解释 的 了 , 的 方差 的 部 分 。 
R° 的 数学 定义 和 一 元 回归 中 的 定义 一 样 : 
K ESS =! _ SSR 
T55 TSS 
这 里 ,被 解释 平方 和 为 ESS = (了 -YV ,总 平方 和 为 788S = L(Y, - Y), 
在 多 元 回归 中 ,只 要 增加 一 个 回归 因子 ,RR 的 值 就 会 增加 ,除非 这 个 新 的 回归 因子 与 原 
来 的 回归 因子 之 间 是 完全 多 重 共 线 的 。 为 了 弄 清楚 这 一 点 ,首先 考虑 来 用 一 个 回归 关子 , 然 
后 再 增加 另 一 个 回归 困 子 。 当 你 用 OL 估计 含有 两 个 回归 因子 的 模型 时 ,OLS 可 以 解 出 使 
残 差 平方 和 最 小 的 系数 值 。 如 果 0LS 求 出 那个 新 的 回归 因子 的 系数 恰好 为 零 ,那么 不 论 加 
归 中 是 否 包含 第 二 个 变量 ,5SR 的 值 都 将 是 相同 的 。 但 如 果 OLS 求 出 的 是 任何 非 零 的 值 ， 
那么 相对 于 不 包括 这 个 回归 因子 的 回归 来 说 ,一 定 是 这 个 值 使 SSR 降低 了 。 在 实际 中 ，, 估 
计 系数 恰好 为 零 的 情况 是 极其 少见 的 ,因此 一 般 而 言 , 当 增加 一 个 新 的 回归 因子 时 ,SSR 将 
会 减 小 。 另 一 方面 ,这 意味 着 当 增加 一 个 新 的 回归 因子 时 ,R 通常 会 增加 (但 从 不 会 减少 ) 


5. 10. 3 “HEH R” 


由 于 当 一 个 新 变量 被 添 加 进来 时 局 会 增加 ,因此 ,六 的 增加 并 不 意味 着 增加 一 个 变量 
确实 会 改进 模型 的 拟 全 程度 。 在 这 个 意义 下 , 正 给 出 了 一 个 回归 对 数据 的 拟 合 程度 的 夸大 
估计 。 纠 正 它 的 一 个 方法 是 用 某 个 因子 来 缩减 或 降低 下 ,这 就 是 调整 的 下 或 尼 MEX, 

JHA R (adjusted R) R E 是 到 的 一 个 外 正 形式 。 当 增加 一 个 新 的 回归 因子 时 , 它 
不 一 定 会 增加 。 关 的 计算 公式 是 : 

m. -— SR r (5.30) 


这 个 公式 与 公式 {5. 29) P R RPO JE 2 BJ] bd RAFS AFAA, k 
上 了 因子 (wn -1)/(n -k-1)。 如 公式 (5. 30) 中 的 第 二 个 表达 式 所 示 , 这 使 得 调整 的 R 等 
于 1 减 去 OLS 残 差 的 样本 方差 { 含有 表达 式 (5. 28) 中 的 自由 度 修正 ) 与 了 的 样本 方差 之 比 。 

关于 及 ,有 三 件 事情 需要 知道 : 

第 一 ,(n -1)/(n-k-1) 总 是 大 于 1, 所 以 屁 AEDT R. 

第 二 ,增加 一 个 回归 因子 对 充 有 两 个 互 为 相反 的 影响 。 一 方面 ,$5R TESE R 增 
加 ; 另 一 方面 ,因子 (a -1)/(n -kk -1) 会 增加 。 此 时 , 尼 是 增加 还 是 减少 取决 于 这 两 个 影 
响 中 哪 一 个 更 强 。 

第 三 , 居 可 能 是 负 的 。 综 合 考虑 , 当 回 归 因 子 使 残 差 平方 和 减少 很 小 的 部 分 ,以 至 于 这 
个 减少 的 量 无 法 浆 补 因子 (na -1)/(n ~-k-1) 的 变化 时 ,就 会 发 生 这 种 情况 。 


5.10.4 R° 和 调整 后 的 R 的 实际 意义 


尼 或 尼 接 近 于 1, 意 味 着 回归 因子 预测 样本 中 因 变 量 值 的 能 力 很 强 ; 若 民 或 民 接近 
于 0, 则 意味 着 它们 不 能 有 效 地 预测 因 变 量 的 变化 。 这 使 得 这 两 个 统计 量 成 为 评价 回归 预 
测 能 力 的 有 效 测 度 。 但 是 ,它们 的 含义 远 非 帮 上 去 那么 简单 。 

EAR RE 时 ,要 当心 四 个 陷 嘲 ， 


(5.29) 


1. R° zk R° 的 增加 并 不 一 定 意 昧 着 增加 的 变量 在 统计 上 是 显著 的 。 不 管 它 在 统计 上 是 
否 是 显著 的 ,只 要 我 们 增加 一 个 回归 因子 ,及 的 值 都 会 增加 。 尼 的 值 不 会 总 是 瑞 加 ,但 如 果 
它 确实 增加 了 ,那么 这 并 不 一 定 意味 着 增加 的 回归 因子 的 系数 在 统计 上 是 显著 的 。 要 确认 
一 个 增加 的 变量 在 统计 上 是 否 是 显著 的 ,你 需要 用 :统计 量 进 行 假设 检验 。 

2. 高 的 到 RR 并 不 意味 着 回归 因子 是 因 变 量 的 真实 原因 。 想 象 一 下 ,我 们 曾 用 考试 
成 绩 对 每 个 学 生 的 停车 场面 积 进行 回归 。 停 车 场 的 面积 和 学 生 一 教师 比 相 关 , 和 郊区 或 市 
区 的 学 校 相关 ,也 可 能 和 地 区 的 收入 水 平 相关 ,许多 事情 都 可 能 和 考试 成 绩 相 关 。 因 此 , 考 
试 成 绩 对 每 个 学 生 停 车 场面 积 的 回归 ,可 能 有 很 高 的 严 或 天 ,但 是 这 个 关系 不 是 因果 关 
系 。( 想 办 法 告诉 教育 主管 ,提高 考试 成 绩 的 方法 就 是 增加 停车 空间 !) 

3. 高 的 色 或 民 并 不 意味 着 不 存在 遗漏 变量 偏差 。 问 想 一 下 5.1 节 中 的 讨论 ,这 些 讨 
论 主要 涉及 考试 成 绩 对 学 生 一 教师 比 回归 中 的 遗漏 变 量 偏差 问题 。 这 个 回归 的 R: 的 作用 
永远 不 会 上 升 ,因为 它 在 这 个 讨论 中 不 起 什么 逻辑 作用 。 遗 汗 变 量 偏差 在 低 E ,适度 R: S 
A E 的 回归 中 都 可 能 发 生 。 反 之 , 低 的 RR 并 不 意味 着 一 定 存 在 遗漏 变 量 偏差 。 

4. AH R RR 并 不 一 定 意 味 着 你 抓 到 了 最 合适 的 回归 因子 集 , 低 的 天 或 尼 也 不 一 
定 意味 着 你 选择 的 回归 因子 集 不 合适 。 在 多 元 回归 中 ,什么 样 的 回归 因子 集 是 最 恰当 的 ? 
这 是 一 个 很 难 回 答 的 问题 ,我 们 讲 完整 本 书 之 后 再 回 到 这 个 问题 。 阿 归 因 子 的 确定 必须 权 
MARTERA ,数据 可 获得 性 和 数据 质量 ,而 最 重要 的 是 经 济 理论 和 所 要 解决 的 问题 的 性 
质 。 这 些 问题 中 没有 一 个 能 用 高 (或 低 ) 的 回归 严 或 于 来 简单 地 回答 。 

这 些 要 点 在 重要 概念 5. 8 中 总 结 。 


[5. 11 遗漏 变量 偏差 与 多 元 回归 


如 果 一 个 遗漏 的 对 的 决定 性 因素 至 少 和 一 个 回归 因子 相关 ,那么 多 元 回归 系数 的 OLS 
估计 量 就 会 存在 遗漏 变量 偏差 。 例 如 ,来 自 富裕 家 庭 的 学 生 通常 比 那些 不 太 富 裕 的 同学 有 
更 多 的 学 习 机 会 ,这 也 可 能 导致 他 们 有 好 的 考 斌 成绩。 此外, 如果 该 地 区 比较 富裕 ,那么 学 
校 候 向 于 有 较 大 的 预算 和 较 低 的 学 生 一 教师 比 。 如 果 是 这 样 的 话 ,那么 学 生 的 富裕 程度 和 
学 生 一 教师 比 将 会 是 负 相 关 的 。 即 使 在 控制 了 英语 学 习 者 的 百分比 后 ,学 生 一 教师 比 系数 
的 OLS 估计 值 也 将 会 提高 地 区 平均 收入 对 考试 成 绩 的 影响 。 简 而 言 之 ,遗漏 学 生 的 经 济 背 
景 可 能 会 使 考试 成 绩 对 学 生 一 教师 比 和 英语 学 习 者 的 百分比 的 回归 中 存在 遗漏 变量 偏差 。 

多 元 回归 中 遗漏 变 量 偏差 的 一 般 条 件 和 一 元 回归 中 的 条 件 类 似 :如 果 遗 漏 变量 是 卫 的 
一 个 决定 性 因素 ,如 果 它 至 少 与 一 个 回归 因子 相关 ,那么 OL 估计 量 将 会 存在 遗漏 变量 偏 
差 。 就 像 在 5.6 节 中 所 讨论 的 ,OLS 估计 量 是 相关 的 ,因此 ,一 般 而 言 ,所 有 系数 的 OLS fi 
计量 将 会 是 有 偏 的 。 多 元 回归 中 关于 和 遗漏 变量 偏差 的 两 个 条 件 在 重要 概念 5.9 中 总 结 。 

在 数学 上 ,如果 满足 站 漏 变量 偏差 的 两 个 条 件 , 那 么 至 少 有 一 个 回归 因子 与 误差 项 相 
关 。 这 意味 着 给 定 X... ,无 .条件 下 n 的 条 件 期 望 值 是 非 零 的 ,这 样 就 违背 了 第 一 个 最 小 
二 乘 假 设 。 因 此 ,即使 样本 容量 很 大 ,遗漏 变 量 偏差 仍 继续 存在 ,也 就 是 说 ,遗漏 变量 偏差 隐 
BA 0LS 估计 量 是 不 一 致 的 。 


重要 概念 5.8 


F mR ;它们 告诉 了 你 什么 ? 它们 又 没 告 课 你 什么 
R iR 告诉 你 回归 因子 是 否 有 效 地 解释 了 或 预测 了 所 研究 的 样本 数据 中 二 变量 的 
值 .如 果 配 (或 居 ) 接 近 于 1 ,那么 在 这 个 样本 中 回归 因子 会 很 好 地 预测 外 变量 的 变化 ,其 








许多 因素 潜在 地 影响 着 一 个 地 区 的 平均 考试 成 绩 。 一 些 影响 考试 成 绩 的 因素 可 能 与 学 
生 一 教师 比 相 关 , 所 以 回归 中 遗 温 它 们 将 会 导致 遗漏 变量 偏差 。 如 果 可 以 获得 这 些 遗 漏 变 
量 的 数据 ,那么 解决 这 个 问题 的 方法 就 是 把 它们 作为 额外 的 回归 因子 包含 在 多元 回归 中 。 
当 我 们 这 样 做 时 ,学 生 一 教师 比 的 系数 ,就 是 在 保持 这 些 其 他 因素 不 变 的 条 件 下 ,反映 学 生 
一 教师 比 的 变化 对 考试 成 绩 的 影响 。 

这 里 ,我 们 考虑 三 个 可 能 影响 考试 成 绩 的 控制 学 生 背景 特 征 的 变量 。 这 些 控制 变 基 之 
一 是 我 们 在 前 面 已 用 过 的 一 个 变 基 , 岂 仍 在 学 习 英 诸 的 学 生 的 比重 。 其 他 两 个 变量 是 新 的 ， 
用 来 控制 学 生 的 经 济 背 景 。 在 数据 集中 ,没有 对 学 生 经 济 背 景 进行 描述 的 较 完 善 的 指标 , 因 
此 ,我 们 引 人 用 来 反映 地 区 低 收入 状况 的 两 个 不 很 完善 的 指标 。 第 一 个 新 的 变量 是 在 学 校 
里 有 资格 得 到 补 其 或 免费 午餐 计划 的 学 生 的 百分比 。 如 果 学 生 的 家 庭 收入 低 于 一 个 特定 的 
收 人 艰 值 (大 约 为 贫穷 线 的 150% ) ,那么 他 们 就 有 资格 享受 这 个 计划 。 第 二 个 新 的 变量 是 
地 区 中 学 生 家 庭 有 资 烙 享 受 加 利 福 尼 亚 州 收入 援助 计划 的 学 生 百分比 。 家 庭 是 否 有 资格 享 
受 这 项 收入 援助 计划 部 分 地 取决 于 他 们 的 家 庭 收 入 ,但 是 其 收入 限 值 比 午 餐 补 助 计划 的 收 
人 限 值 低 { 更 严格 ) 。 因 此 ,这 两 个 变量 测度 了 该 地 区 经 济 条 件 不 好 的 学 生 的 比例 ,虽然 它 
们 是 相关 的 ,但 是 它们 不 是 完全 相关 的 (它们 的 相关 系数 是 0. 74) 。 尽 管理 论 表明 经 济 背 最 
可 能 是 一 个 重要 的 遗漏 因素 ,但 是 理论 和 专家 判断 实际 上 没有 帮 我 们 决定 这 两 个 变量 中 
《有 资格 享有 补助 午餐 的 学 生 百 分 比 或 有 资格 享有 收 人 补助 的 学 生育 分 比 ) 哪 一 个 是 经 济 
背 最 的 较 好 测度 。 就 我 们 的 基准 设 定 而 言 ,我 们 选择 有 资 烙 享 有 午餐 补助 计划 的 学 生 百 分 
比 作为 经 济 背 景 变量 ,但 我 们 也 考虑 了 包含 其 他 变量 的 备 择 设 定 。 

考试 成 绩 和 这 些 变量 的 散 点 图 在 图 5 一 2 中 给 出 。 这 些 变量 中 每 一 个 都 显示 出 与 考试 
成 绩 的 负 相关 关 系 。 考 试 成 绩 和 英语 学 习 者 百分比 之 间 的 相关 系数 为 -0.64; 考 试 成 绩 和 
有 资格 享有 午餐 补 起 计划 的 学 生 百 分 比 之 间 的 相关 系数 为 -0. 87 :考试 成 绩 和 有 资格 享有 
收入 援助 计划 的 学 生 百 分 比 之 间 的 相关 系数 为 -0. 63。 

现在 我 们 面临 一 个 交流 的 问题 。 什 么 样 的 方式 是 表现 包含 多 个 回归 因子 数据 子 集 的 多 
个 多 元 回归 方程 结果 的 最 好 方式 ? 到 目前 为 止 ,我们 是 用 写 出 像 公式 (5. 18) 那样 所 估计 的 
回归 方程 的 形式 提供 回归 结果 。 当 只 有 几 个 回归 因子 和 几 个 加 和 妇 方 程 时 ,这 样 做 是 可 以 的 ， 
但 是 在 有 多 个 回归 因子 和 多 个 方程 的 情况 下 ,这 种 表示 方法 可 能 会 不 好 交流 ,也 不 好 理解 。 
看 来 ,交流 多 个 回归 方程 结果 的 一 个 比较 好 的 方法 是 用 表格 。 

表 5 一 2 中 归纳 了 考试 成 绩 对 不 同 子 集 的 回归 因 了 于 回归 的 结果 。 每 一 列 总 结 了 一 个 单 
独 的 回归 ,每 个 回归 都 有 相间 的 因 变量 一 一 考试 成 绩 。 前 五 行 中 的 子 项 是 所 估计 的 回归 系 
数 ,它们 的 标准 误 在 其 下 面 的 括号 里 给 出 。 星 号 表示 检验 相关 的 系数 为 零 的 假设 ,其 :统计 
量 在 5 镶 的 水 平 下 是 否 是 显著 的 (' ) ,或 在 1% 的 水 平 下 是 否 是 显著 的 ("“ ) 。 表 5 一 2 的 最 
后 三 行 包含 了 回归 的 总 括 性 统计 其 (回归 的 标准 误 SET 和 调整 的 到 即 妨 ) 和 样本 容量 ( 它 
对 于 所 有 的 回归 都 是 一 样 的 , 即 420 个 观察 值 ) 。 

到 目前 为 止 ,我 们 以 方程 形式 给 出 的 所 有 信息 都 列 在 这 个 表格 的 一 列 中 。 例 如 ,考虑 没 
有 控制 变量 时 的 考试 成 绩 对 学 生 -- 教 师 比 的 回归 。 用 方程 形式 表示 ,这 个 回归 是 ， 


— n — 
TestScore = 698.9 - 2.28 x STR,R =0.049,SER =19. 26,7 =420 (5.31) 
(10.4) (0.52) 


所 有 这 些 信息 都 显示 在 表 5 一 2 的 第 (1) 列 中 。 学 生 一 教师 比 的 估计 系数 ( -2 28) 出 现在 
第 一 行 的 于 项 中 ,而 它 的 标准 误 (0. 52) 就 出 现在 估计 系数 下 面 的 括号 里 。 截 距 (689. 9) 和 
它 的 标准 误 (10.4) 在 标 有 " 截 距 ” 的 那 一 行 中 给 出 (有 时 你 会 看 到 这 一 行 标 有 “常数 ”, 因为 

















四 英语 学 号 者 的 百分比 l (有 资格 享有 午餐 补助 计划 的 学 生 的 百分比 
考试 成 绩 





(中 有 资格 享有 收入 援助 计划 的 学 生 的 百分比 


注 : 散 点 图 显示 了 考试 成 绩 和 下 列 指 标 间 负 相关 的 关系 。 即 ; (a) 与 英语 学 习 者 的 百分比 ( 相关 系 
数 = -0.64) ;(b) 与 有 资格 享有 午餐 补助 计划 的 学 生 的 百分比 (相关 系数 = -0 87):(e) 与 有 资格 享有 
收入 提 助 计划 的 学 生 的 百分比 (相关 系数 = -0 63), 
图 5 一 2 考试 成 绩 对 三 种 学 生 特 征 的 散 点 图 
如 5.2 节 中 所 讨论 的 , 截 距 可 被 看 做 为 总 是 等 于 1 的 回归 因子 的 系数 ) 。 同 再 , 闫 (0. 049) ， 
SER(18. 58) 和 样本 容量 a(420) 在 最 后 一 行 中 出 现 。 其 他 回归 因子 行 中 空白 的 子 项 表示 ， 
那些 向 归 因 子 不 包 会 在 这 个 回归 中 。 

尽管 表 5 一 2 没有 报告 ! 统计 量 ,但 是 这 些 能 够 根据 所 提供 的 信息 计算 得 到 ,例如 ,检验 
第 (1) 列 中 学 生 一 教师 比 的 系数 为 零 的 假设 的 :统计 量 是 ( -2. 28) +0.52 = -4 38。 这 个 
假设 在 1 久 的 显著 性 水 平 下 被 拒 物 , 它 用 表 中 估计 系数 后 面 的 ””” "来 表示 。 

包含 测度 学 生 特 征 的 控制 变量 的 回归 报告 在 第 (2) ~ 第 (5) 列 中 给 出 。 如 前 面 公式 
(5. 16) 所 述 ,第 (2) 列 报告 了 考试 成 绩 对 学 生 一 教师 比 和 英语 学 习 者 的 百分比 的 回归 。 

第 (3) 列 提供 了 基准 设 定 ,其 中 回归 因子 是 学 生 一 教师 比 和 两 个 控制 变量 一 一 英语 学 
习 者 的 百分比 与 享有 免费 午餐 的 学 生 的 百分比 。 

第 (4) 列 和 第 (5) 列 提供 了 备 择 设 定 , 它 研究 了 已 被 测度 的 学 生 经 济 背 景 情况 的 变化 对 
考试 成 绩 的 影响 。 在 第 (4) 列 中 ,得 到 公众 援助 的 学 生 的 百分比 作为 一 个 回归 因子 被 包含 
进来 ,而 在 第 (5) 列 中 ,两 个 经 济 背 景 变量 都 被 包含 进来 了 。 

这 些 结果 给 出 了 三 个 结论 : 

L 控制 这 些 学 生 特征 之 后 ,学 生 一 教师 比 对 考试 成 绩 的 影响 大 约 减 少 了 一 半 。 这 个 估 
计 的 影响 对 电 一 个 特定 的 控制 变量 被 包含 在 同 归 中 不 是 非常 敏感 的 。 在 所 有 的 情形 下 ,学 


生 一 教师 比 的 系数 在 5 名 的 水 平 下 在 统计 上 都 是 显著 的 。 在 含有 控制 变量 的 四 个 设 定 的 回 
归 (2) ~(5) 列 中 ,如 果 保持 学 生 特征 不 变 ,对 学 生 一 教师 比 这 一 指标 来 说 ,平均 每 名 教师 减 
少 上 名 学 生 , 那 么 情 计 的 结果 是 使 平 沟 考试 成 绩 担 高 大 约 1 分 。 


表 5 一 2 


(利用 加 利 福 尼 亚 州 小 学 学 区 的 数据 ) 


因 变 量 ; 学 区 的 平均 考试 成 绩 





考试 成 绩 对 学 生 一 教师 比 和 学 生 特 征 控制 变量 的 回归 结果 


















































TA E (1 (2) . 3) (4) i5] 
EERIE, ) -2.28** -1.10* -1.00** -1.341 ** -1.01 
(0.52) (0.43) (0.27) (0.34) (0.27) 
英语 学 习 者 的 百分比 LX,) — 0. 650 * ` —-0.122" -0.488'* -0.130% 
(0.031) (0.033) (0.030) (0.036) 
享有 午餐 补助 计划 的 学 生 的 | _ 0. 547 * * — 0. 529 
HHE) (0.024) (0.038) 
享有 公众 收入 援助 计划 的 -0.790"" 0, U48 
FERATE) (0. 068) (0.059) 
截 距 698.977 686. 0" ` 700. 2 * * 698. 0 * * 700. 4 " " 
(10.4) (8.7) (5.6) (6.9) (5.5) 
Wii Eitt 
SER 18. 58 14.46 9.08 11. 65 9, 08 
Fa 0.049 0.424 0 773 0. 626 0.773 
n 420 420 420 420 420 


注 : 这 些 回归 是 用 附录 4. 1 中 所 介绍 的 加 利 福 尼 亚 州 的 X-8 学 区 的 数据 来 估计 的 。 标 准 误 在 系数 下 
耐 的 括号 中 给 而。 利用 双边 检验 ,单个 系数 在 "5% 的 显著 性 水 于 或 "" 1 名 的 显著 性 水 平 下 在 统计 上 是 显 
著 的 。 

2、 学 生 特 征 的 变量 对 于 考试 成 绩 是 非常 有 用 的 预测 因子 。 学 生 一 教师 比 仅 仅 解 释 了 
考试 成 绩 变化 的 一 小 部 分 ;第 (1) 列 中 的 E 为 0.049。 然 而 , 当 增加 学 生 特 征 变量 时 , 闵 会 
跳 牙 式 地 增加 。 便 如 ,基准 设 定 区 与 (3) PR R° 值 为 0.373。 学 生 人 口 统计 变量 的 系数 的 
符号 与 图 5 一 2 h ñFe st E . 致 的 ;有 很 多 英语 学 习 者 的 地 区 和 有 许多 穷 孩 子 的 地 区 有 较 低 
的 考试 成 绩 。 

3. 个 别 地 看 ,控制 变量 在 统计 上 不 总 是 显著 的 。 在 设 定 (5) 中 ,享有 收入 援助 的 学 生 的 
百分比 的 系数 为 零 的 假设 在 5 名 的 水 平 下 (: 统计 量 是 -0. 82) 没有 被 拒绝 。 因 为 在 基准 设 
定 (3) 的 回归 中 ,增加 这 个 控制 变量 对 估计 系数 及 其 标准 误 的 影响 是 可 以 忽略 的 ,和 而且 因 为 
在 设 定 (5) 中 这 个 控制 变量 的 系数 在 统计 上 不 是 显著 的 ,所 以 至 少 对 这 个 分 析 的 目的 而 言 ， 
这 个 新 增 的 控制 变 基 是 多 余 的 。 


[2. 13 结论: 


本 章 以 一 个 令 人 忧虑 的 问题 开始 :在 考试 成 绩 对 学 生 一 教师 比 的 回归 中 ,被 遗漏 的 那些 
影响 考试 成 绩 的 学 生 特 征 可 能 和 地 区 中 的 学 生 一 教师 比 相关 ,和 而 且 如 果 是 这 样 的 话 , 这 些 地 
区 中 的 学 生 一 教师 比 会 增加 这 些 址 漏 的 学 生 特 征 对 考试 成 绩 的 影响 。 因 此 , OLS 佑 计量 将 
会 存在 壮 漏 变量 偏差 。 为 了 缓解 这 个 潜在 的 潮 漏 变量 偏差 ,我 们 通过 将 控制 不 同学 生 特征 
的 变量 包含 在 回归 中 (英语 学 习 者 的 百分比 和 学 生 经 济 背 景 的 两 个 测度 ) 来 扩展 回归 模型 。 
这 样 做 会 使 学 生 一 教师 比 单位 变化 的 估计 影响 减少 一 半 , 尽 管 在 保持 这 些 控制 变量 不 变 的 
情况 下 , 它 仍 有 可 能 在 5% 的 显著 性 水 平 下 拒绝 对 考试 成 绩 的 总 体 影响 为 零 的 零 假 设 。 因 
为 它们 消除 了 由 这 些 学 生 特 征 所 引起 的 遗漏 变量 偏差 ,所 以 就 为 教育 主管 提供 建议 而 言 , 这 





些 多 元 回 好 估计 值 {( 及 相关 的 置信 区 间 ) 比 第 4 章 中 的 单个 回归 因子 的 估计 值 要 有 用 得 多 。 

本 章 中 的 分 析 已 假设 回归 因子 中 的 总 体 回 归 函 数 是 线性 的 ,也 就 是 说 ,给 定 回 妇 因子 ， 
V, 的 条 件 期 望 是 一 条 直线 。 但 是 ,这 样 考虑 并 设 有 什么 特定 的 原因 。 实 际 上 ,在 大 班 地 区 
减少 学 生 一 教师 比 的 影响 可 能 非常 不 同 于 对 小 班 地 区 的 影响 。 如 果 是 这 样 的 话 ,总 体 回 归 
线 与 变量 X 之 间 就 不 是 线性 的 关系 ,而 是 关于 变量 X 的 非 线性 函数 。 然 而 ,要 将 我 们 的 分 
析 推 广 到 变量 的 非 线 性 回归 沙 数 情形 ,我们 需要 应 用 下 一 章 所 开发 的 工具 。 


-总结 


1. 泪 漏 变量 偏差 发 生 的 条 件 是 ;(1) 与 引 人 的 回归 因子 相关 ; (2) 是 了 的 一 个 决定 性 
因素 。 

2. 多 元 回归 模型 是 包含 多 个 回归 因子 ,… ,XX 的 线性 回归 模型 。 与 每 个 回归 因子 相 
联系 的 是 回归 系数 局 ,…,B;。 系 数 B, 的 含义 是 ,在 保持 其 他 回归 因子 不 变 的 情况 下 ,与 总 
的 单位 变化 相 联系 的 了 的 期 望 变化 。 其 他 回归 系数 的 解释 与 此 类 似 。 

3. 多 元 回归 中 的 系数 可 以 用 OLS 进行 估计 。 当 满足 重要 概念 5. 4 中 的 四 个 最 小 二 乘 
假设 时 ,OLS 全 计量 在 大 样本 条 件 下 是 无 偏 的 一致 的 且 服 从 正 态 分 布 。 

4. 单个 回归 系数 的 假设 检验 和 置信 区 间 的 构建 ,可 以 用 和 第 4 章 的 单 变量 线性 回归 横 
型 中 所 使 用 的 本 质 上 相同 的 程序 来 进行 。 例 如 ,B, 的 笔 % 的 置信 区 间 由 启 +1. 965E, ) 
给 出 。 

5. 涉及 一 个 以 上 的 系数 约束 条 件 的 假设 被 称 为 联合 假设 。 联 合 假设 可 以 用 下 统计 量 
进行 检验 。 

”6. 回归 的 标准 误 尼 FI R° 是 多 元 回归 模型 的 总 括 性 描述 统计 量 。 





[重要 术语 ; 
遗漏 变量 偏差 ”多 元 回归 模型 ”总 体 回 归 线 ”总 体 回归 尔 数 ” 截 忠 和 的 系数 控 
HEE 偏 效 应 ”总 体 多 元 回归 模型 ”同方 差 蜡 方差 AB. B, 的 91S 估计 量 OLS 
回归 线 ”预测 值 RE 完全 多 重 共 线 性 不 完全 多 重 共 线 性 ”约束 条 件 ”联合 假设 
FE SOBERE RREH) 基准 设 定 备 择 设 定 经 验 规则 下 统 
计量 


[复习 概念 

5.1 和 研究 人 员 对 计算 机 的 使 用 情况 对 考试 成 绩 的 影响 感 兴趣 。 利 用 本 章 中 所 用 的 校 
区 数据 ,该 研究 人 员 用 地 区 的 平均 考试 成 绩 对 平均 每 个 学 生 的 计算 机 数 进行 回归 。 在 分 析 
增加 学 生 人 均 计 算 机 数 对 考试 成 绩 的 影响 时 ,估计 量 房 是 无 偏 估计 量 吗 ? 为 什么 是 或 为 什 
么 不 是 ? 如果 你 认为 房 是 有 偏 的 ,那么 它 是 向 上 偏 还 是 向 下 偏 ? 为 什么 ? 

5.2 一 个 多 元 回归 包 会 两 个 回归 因子 ;了 =ñ + 有 TEL +8,X;, tHo 如 果梨 持 X, AE, 
X, 增加 3 个 单位 对 了 的 期 望 变化 是 和 多少? MEER X, 不 变 ,X, 减少 5 个 单位 对 了 的 期 望 
变化 是 多 少 ?如 果 X, 增加 3 个 单位 ,X, 减少 5 个 单位 ,那么 了 的 期 望 变化 又 是 多 少 ? 





b. 


5.1 APRM GAOR ”人 的 ) 以 表示 系数 的 统计 显著 性 程度 。 

5.2 HASTHHK R°, 

5.3 利用 第 (1) 列 中 的 回 妇 结果 : 

“a. 平均 来 讲 , 有 大 学 学 历 的 工人 是 否 比 只 有 高 中 文 赁 的 工人 人 接 得 多 ? 多 多 少 ? RE 
这 个 回归 上 所 估计 的 收入 差异 在 5% 的 水 平 下 在 统计 上 是 否 是 显著 的 ? 

b. 平均 来 讲 ,男性 是 否 比 女性 接 得 多 ? 多 多 少 ? 根据 这 个 回归 所 舍 计 的 收入 差异 在 
5 名 的 水 平 下 在 统计 上 是 否 是 显著 的 ? 

5.4 利用 第 (2) 列 的 回归 结果 ， 

a 年 龄 是 否 是 站 入 的 一 个 重要 的 决定 性 因素 ?请 解释 说 明 。 

b. Saly 是 一 位 29 岁 的 女 大 学 毕业 生 。Betty 是 一 位 34 岁 的 女 大 学 毕业 生 。 预 测 Sally 
和 Betty 的 收 大 ,并 桔 造 她 们 收入 之 间 期 望 差 异 的 35% 的 置信 区 间 。 

5.5 利用 第 (3) 列 中 的 回归 结果 : 

a. 收入 是 否 存 在 重要 的 地 域 差异 ? 

b. 为 什么 回归 中 遗漏 了 回归 因子 West? 如 果 它 被 包含 进来 ,会 发 生 什 么 情况 ? 

"e. Juanita 是 一 位 来 自 于 南部 的 28 岁 的 女 大 学 毕业 生 , Moy 是 一 位 来 自 于 本 部 的 2 
岁 的 女 大 学 毕业 生 ,Jennifer 是 一 位 来 自 于 中 西部 的 28 岁 的 女 大 学 毕业 生 。 

ci. 构造 Juanita 和 Molly 之 间 期 望 收入 之 差 的 95% BJ 38 18 PZ |a], 

cii. 计算 Juanita 和 Jennifer 的 期 望 收入 之 差 。 

ciii, 解释 说 明 如 何 构造 Juanita 和 Jennifer 之 间 期 望 收 和 信之 差 的 由 多 的 置信 区 和 阁 。( 提 
示 : 如 果 你 在 回归 中 包含 了 West 并 删除 了 Midwest ,会 发 生 什 么 情况 ?) 

56 重新 估计 第 (2) 列 中 所 显示 的 回归 ,这 次 使 用 1992 年 的 数据 (4 000 个 观察 值 是 
从 1993 年 3 月 的 CPS 中 随机 选择 的 ,利用 消费 者 价格 指数 将 其 转换 为 1998 年 的 美元 ) , 结 





果 是 : 
AHE = 0.77 - 5.29 College- 2.59 Ferale + 0.40 Age ,SER = 5. 85 , ° =Ü. 21 
(0.98) (0.18) (0.18) (0.035 
将 这 个 回归 与 第 (2) 列 所 显示 的 对 1998 年 数据 的 回归 相 比 较 , College 的 系数 在 统计 上 是 理 
存在 显著 的 变化 ? 


“5.7 评价 下 面 的 陈述 :" 在 所 有 的 回归 中 ,Female 的 系数 是 负 的 ,大 的 ,而 且 在 统计 上 
是 显著 的 。 这 提供 了 在 美国 劳动 力 市 场 上 存在 性 别 歧视 的 强 统计 证 据 。 

5.8 EDMAR: Y, =A +8 Xn +BX, + tu。 用 5.8 节 中 的 "方法 2” 变 换 这 个 回归 ， 
这 样 你 可 以 用 上 统计 量 进行 检验 ， 

a. B. =ñ; 

b. B, +aß, =0, 这 里 4 是 个 常数 ; 

cB +B, =1。( 提 示 : 你 必须 重新 定义 回归 中 的 因 变 量 ) 

5.9 附录 5.3 证 明了 经 验 规则 正统 计量 的 两 个 公式 ;公式 (5. 38) 和 和 公式 (5.39)。 证 
明 : 这 两 个 公式 是 等 价 的 。 


经 
bp [附录 5. 1 表达 式 (5. 1) 的 推导 ] 


本 附录 介绍 了 表达 式 (5. 1) 中 的 但 漏 变量 偏差 公式 的 推导 。 附 录 4. 3 中 的 公式 (4. 51) 
说 明了 : 











5.7 节 中 的 五 统计 量 。 

本 附录 描述 了 检验 联合 假设 的 其 他 两 种 方法 , 即 当 你 只 有 回归 分 析 结 果 表 时 ,可 以 使 用 
这 丙种 方法 。 第 一 种 方法 是 Bonferroni 检验 , 它 是 基于 Bonfemoni 不 等 式 的 一 个 非常 一 般 的 
检验 方法 的 应 用 。 第 二 种 方法 是 经 验 规则 五 统计 量 , 它 是 多 元 回 妆 的 一 个 很 专 亲 的 方法 ， 
只 有 在 谋 差 项 是 同方 差 的 时 ,这 种 方法 在 理论 上 才 是 合理 的 。 经 验 规则 玉 统 计量 是 用 仅 适 
用 于 同方 差 的 标准 误 计 算 的 :统计 量 所 对 应 玉 统 计量 。 


Bonferroni 检验 


Bonferroni 检验 是 基于 ! 统 计量 对 单个 假设 的 联合 假设 的 检验 , 即 Bontemoni 检验 是 5.7 
节 中 介绍 的 效果 较 好 的 “每 次 一 个 "方法 的 上 统计 量 检验 。 基 于 临界 值 = >0 ,联合 零 假设 启 ， 
=Bio 和 8B =B, BJ Bonferroni 检验 { Bonferroni test) 的 规则 是 ， 
WR se Hini e MARET MAE (5.35) 
【Bonferoni* 每 次 一 个 "方法 的 + 统计 量 检 验 ) 
这 里 ,5 和 所 分 别 是 检验 B 和 8B 的 约束 象 件 的 :统计 量 。 
选择 临界 值 c 可 以 采用 这 样 的 技巧 ; 当 零 假设 为 真 时 , “每 次 一 个 ”的 检验 拒绝 零 假设 
的 概率 不 超过 所 想 要 的 显著 性 水 平 ,比如 说 5 竞 。 选 择 临 界 值 " 可 以 通过 使 用 Bonferroni 的 
不 等 式 完成 ,这 种 方法 既 考 虑 到 了 同时 检验 两 个 约 东 条件, 同时 又 考虑 到 了 乓 和 之 间作 
何 可 能 的 相关 性 。 
Bonferroni 的 不 等 式 
Bonferroni 不 等 式 是 概率 论 的 一 个 基本 结果 。 设 4 和 是 为 两 个 事件 。 没 4 门 如 为 "4 和 
8 同时 发 生 " 的 事件 (4 和 8 的 交集 ) TAUB 为 “4 和 上 8 至 少 有 一 个 发 生 " 的 事件 (4 和 8 
的 并 集 ) ,那么 ,Pr(AUB) =Pr(4) +Pr(8) -Pr(4m8)。 由 于 Pr(4m8) 0, 由 此 可 得 六 
(AUB)=P0(A) +Pr(B8)。 这 个 不 等 式 也 事 转 换 为 1 — Pr('AUB)2z 1 -~ [Pr(A) +Pr(B)]。 
PEA FR 分 别 是 4 M B R, B AE A"R IE BEF, ATAUR RIRA A NB, A 
KA 1-Pr(AUB) =Pr( A NE) ,这 就 得 到 了 Bonferroni PEA Pr(A NB )=1 -[Pr(A) + 
Pr(B)], 
现在 设 4 ARGI >e, B AEn! >e, 那 么 由 不 等 式 Pr( AU B)=Pr(A) + Pr 
《B8}) 可 以 得 到 ， 
Pré lt l >e 和 11>c 至 少 有 一 个 发 生 ) Pria l >e) +Prt 15 l >c) (5,36) 
Bonferroni 检验 
BFE l > c 和 和 | >e 至 少 有 一 个 发 生 " 是 “每 次 一 个 "检验 的 皂 绝 域 , 因 此 ,表达 
式 (5.36) 提 供 了 选择 临界 值 的 一 种 方法 ,这 种 方法 使 得 “每 次 一 个 "的 :统计 量 在 大 样本 
条 件 下 实现 想 要 的 显著 性 水 平 。 在 大 样本 的 零 假设 下 ,Pr(it1 >e) =Pr(Irl >e) =Pr(1Z! 
>e) ,因此 ,表达 式 (5. 36) 意 昧 着 在 大 样本 条 件 下 “每 次 一 个 ”的 检验 在 零 假设 下 拒绝 零 假 
设 的 概率 是 : 
Pr, (“ 每 次 一 个 "的 检验 拒绝 ) <2P-( 121 > e) (5.37) 
表达 式 (5. 37) 中 的 不 等 式 提供 了 选择 临界 值 的 一 种 方法 ,该 方法 在 零 假 设 下 拭 绝 的 
概率 等 于 想 要 达到 的 显著 性 水 平 。Bonferroni 方法 可 以 扩展 到 两 个 以 上 系数 的 情形 。 如 果 
在 零 假设 下 有 4 个 约束 条 件 ,那么 用 ç 来 代替 表达 式 (5. 37) 中 右边 的 因子 2。 
表 5 一 3 给 出 了 在 不 同 的 显著 性 水 平 下 ,g =2.9=3 和 g=4 时 ,“ 每 次 一 个 "的 Bonferroni 
迷 验 的 临界 值 <。 例 如 ,假设 想 要 的 显 鞭 性 水 平 为 5% , 且 4=2, 根 据 表 5 一 3 ,临界 值 c 为 


2.241。 这 个 临界 值 是 标准 正 态 分 布 的 1.25 铝 百 分 位 数 , 所 以 Pr(12Z1 >2. 241) =2.5% , H 
E REAR. 37) 告 诉 我 们 ,在 大 样本 中 ,表达 式 (5. 35) 中 “每 次 一 个 "的 检验 在 零 假设 下 至 











多 有 5 铝 的 机 会 拒绝 零 假设 。 
表 5 一 3 检验 联合 假设 的 "每 次 一 个 " 的 1! 统 计量 的 Bontferroni 临界 值 c 
R it k 3E 
约束 条 件 个 数 (9) 
10% 5% 1 
2 1.960 2.241 2. 807 





3 | 2. 128 2, 394 2.935 
4 2. 241 2. 498 3. 023 


表 5 一 3 中 的 临界 值 比 检 验 单个 约束 条 件 的 临界 值 大 。 例 如 ,在 9 =2 时 ,如 果 至 少 有 一 
个 :1 统计 量 的 绝对 值 大 于 2.241, 那 么 “每 次 一 个 "的 检验 将 拒绝 零 假设 。 这 个 临界 值 大 于 
1, 9%6 ,因为 如 同 在 5. 7 节 中 所 讨论 的 ,通过 考察 两 个 上 统计 量 , 你 得 到 了 第 二 次 机 会 拒绝 联 
合 零 假设 ,所 以 上 述 的 临界 值 被 做 了 适当 的 修正 。 

如 果 单 个 的 :统计 量 是 以 异 方 差 稳健 的 标准 误 为 基础 的 ,那么 不 论 是 否 存在 异 方差 ， 
Bonferroni 检验 都 是 有 效 的 ,但 是 如 果 t 统计 量 是 基于 仅 适 用 于 同方 差 的 标准 误 的 ,那么 只 
有 在 同方 差 条 件 下 Bonferroni 检验 才 是 有 效 的 。 

在 考试 分 数 例 子 中 的 应 用 

检验 公式 (5. 18) 中 关于 考试 成 绩 和 平均 每 个 学 生 费 用 的 真实 系数 的 联合 零 假设 的 : 统 
计量 分 别 是 = -0 的 和 户 =243。 尽 管 1461<2241, 但 因为 151>2.241, 所 以 用 
Bonferroni 检验 ,我 们 能 够 在 5 色 的 显著 性 水 平 下 拒绝 联合 零 假设 。 然 而 ,hh #lr, 的 绝对 值 
都 小 于 2. 807 ,因此 用 Bonferroni 检验 ,我 们 不 能 在 1% 的 显著 性 水 平 拒绝 联合 办 假 设 。 相 
反 , 使 用 5.7 节 中 的 正统 计量 ,我 们 却 能 够 在 1% 的 显著 性 水 平 下 拒绝 这 个 假设 。 


经 验 规 则 统计 量 


经 验 规 则 下 统计 量 是 在 两 个 回归 的 残 差 平方 和 的 基础 上 用 一 个 简单 的 公式 计算 得 到 
的 。 在 第 一 个 回归 中 ,也 邯 被 称 为 有 约束 的 回归 (restricted regression) 中 , 零 假 设 是 被 强 
制 为 真 的 。 当 党 假设 是 表达 式 (5. 20) 中 的 类 型 时 ,其 中 所 有 的 假设 值 都 是 党 ,有 约束 的 回 
妇 是 将 这 些 系数 设 定 为 0 的 回归 ,也 就 是 说 ,相关 的 回 妇 关子 被 排除 在 回归 之 外 。 在 第 二 个 
回归 中 ,也 即 被 称 为 无 约束 的 回归 {unrestricted regression) 中 , 备 择 假设 是 允许 为 真 的 。 
如 果 无 约束 的 回归 中 的 残 差 平方 和 比 有 约束 的 回归 中 的 残 差 平方 和 足够 地 小 ,那么 检验 将 
AFER. 
经 验 规则 下 统计 量 ( rule-of-thumb F-statistic) H Fz HE : 
_ {SSR nanea — SSR a) /9 
SSR rnas (n = Kasana —1) 
这 里 ,SS5R,sws 是 有 约束 的 回归 的 残 差 平方 和 ,55R,ww 是 无 约束 的 回归 的 残 差 平 方 和 ,gq 
是 零 假设 下 的 约束 条 件 个 数 , 上 ww 是 无 约束 的 回归 中 国 归 因子 的 个 数 。 经 验 规则 下 统计 
量 的 另 一 个 等 价 的 公式 ,是 以 两 个 回归 的 R 为 基础 计算 的 , 即 : 
a P ated A 
E O E (5.39) 


如 果 误 差 项 是 同方 差 的 ,那么 用 公式 (5. 38) 计 算 的 经 验 规则 下 统计 量 和 5.7 节 中 所 用 





(5.38) 














到 的 统计 量 之 间 的 差异 会 随 着 样本 容量 n 的 增加 而 逐渐 消失 。 因 而 ,如 果 误 差 项 是 同方 
益 的 ,那么 在 大 样本 中 ,经 验 规 则 下 统计 量 在 零 假设 下 的 抽样 分 布 是 Fae 。 

这 些 经 验 规则 公式 是 易于 计算 的 ,而 且 根 据 有 约束 的 和 无 约束 的 回归 对 数据 的 拟 合 程 
度 如 何 有 直观 的 解释 。 址 憾 的 是 ,只 有 当 误 善 项 是 同方 差 的 时 ,它们 才 是 有 效 的 。 因 为 同方 
差 是 一 种 极 特 殊 的 情况 ,我 们 不 能 指望 在 经 济 数据 应 用 中 或 在 更 一 般 的 社会 科学 数据 应 用 
中 出 现 同方 差 的 情况 ,因此 经 验 规则 下 统计 量 不 是 5.7 节 中 异 方 差 稳 健 的 下 统计 量 的 一 个 
满意 的 替代 。 

在 考试 成 绩 和 学 生 一 教师 比 案例 中 的 应 用 

在 控制 PctEL 的 情况 下 ,为 了 检验 关于 STR 和 Expr 的 总 体系 数 均 为 备 的 零 假 设 ,我 们 
需要 计算 有 约束 的 和 无 约束 的 回归 中 的 $5R( 或 忆 )。 无 约束 的 回归 中 会 有 回归 因子 STR, 
Expn 和 Pet ,由 公式 (5.18) 给 出 ; 它 的 产 是 0.4366, 即 下 ， ,=0.4366。 对 有 的 东 的 回 
归 施 加 了 关于 SIR 和 Expn 的 真实 系数 均 为 零 的 联合 零 假设 , 即 在 零 假 设 下 SIR 和 Expr 不 
进入 曾 体 回归 ,尽管 PerEL 进入 总 体 回归 { 零 假 设 没 有 约束 PerEL 的 系数 )。 用 OLS 所 估计 
的 有 约束 的 回归 是 : 


— 
TestScore = 664.7 - 0.671 x PetEL,R = 0. 4149 (5.40) 
(1.0) (0.032) 


因此 Reana =0.4149。 约 束 条 件 个 数 为 9=2, 观 察 值 个 数 为 n =420, 无 约束 的 回归 中 国 归 
因子 的 个 数 为 =3。 用 公式 (5. 39) 计 算 的 经 验 规则 下 统计 量 是 : 
F=[{0.4366 -0.4149)/2]/[{1 -0.4366)/(420 -3 -1)] =8.01 

由 于 8.01 大 于 1% 的 临界 值 4. 61, 因 此 利用 这 个 经 验 规 则 方法 , 零 假设 在 1% 的 显著 性 水 平 
下 被 拒绝 。 

这 个 例子 阐明 了 经 验 规 则 下 统计 量 的 优 缺 点 。 它 的 优点 是 它 可 以 用 计算 器 进行 计算 。 
它 的 缺点 是 经 验 规则 严 统 计量 的 值 可 能 完全 不 同 于 5.7 节 中 所 用 的 异 方差 稳健 的 下 统计 
基 : 检 验 这 个 联合 假设 的 异 方差 稳健 的 下 统 计量 的 值 为 $. 43 ,与 不 太 可 靠 的 仅 送 用 于 同方 
差 的 经 验 规则 值 8. 01 之 间 有 较 大 的 不 同 。 
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在 第 4 章 和 第 5 EY, E kula S ak RA X SW hay ATEI, S Ak ea 3 St 5 8k ak 
是 常数 ,因此 ,下 的 单位 变化 对 了 的 影响 并 不 依赖 于 下 本 身 的 取 值 。 但 是 ,如 果 五 的 变化 对 
了 的 影响 依 闲 于 一 个 或 多 个 自 变量 的 取 值 ,那么 总 体 回归 肖 数 是 什么 样 的 呢 ? 如 果 是 这 样 
的 话 ,总体 回归 函数 就 是 非 线 性 的 。 

本 章 提 出 了 两 组 发 现 非 线性 总 体 回归 函数 并 对 其 进行 建 模 的 方法 。 当 一 个 自 变 量 碾 
的 变化 对 了 的 影响 依 精 于 X 本 身 的 取 值 时 ,第 一 组 方法 是 有 用 的 。 比 如 ,在 班级 规模 已 经 
比较 小 的 情况 下 ,将 班级 规模 指标 即 每 个 教师 分 担 的 学 生 数 减少 一 人 , 比 在 那些 班级 规模 已 
经 很 大 ,以 至 于 教师 除了 控制 班级 秩序 以 外 几乎 不 能 做 什么 的 情况 下 ,会 产生 更 大 的 影响 。 
如 果 是 这 样 的 话 ,考试 成 绩 (四 将 是 学 生 一 教师 比 ( 了 Li ) 的 非 线性 函 孝 ,这 里 当 X 很 小 时 ,这 
个 函数 是 比较 陡峭 的 。 图 6 一 1 显示 了 具有 这 个 特征 的 非 线性 函数 的 一 全 例子 。 图 6 一 ] 
{a) 中 的 线性 总 体 回 归 涵 数 具 有 一 个 常数 斜率 ,而 图 6 一 1(b)j 中 的 非 线性 总 体 回归 函数 当 
X, BRE ahe E X 值 很 大 时 的 儿 率 陡峭 。 这 个 第 一 组 的 方法 在 6.2 节 中 论述 。 

35 X, 的 变化 对 了 的 影响 依赖 于 嚼 一 个 自 变 量 时 ,比如 说 妃 ,第 二 组 方法 是 有 用 的 。 例 
如 , 仍 在 学 习 英 语 的 学 生 尤 其 可 能 会 受益 于 有 较 多 的 一 对 一 的 美 注 。 如 果 是 这 样 的 话 ,降低 
学 生 一 教师 比 对 考试 成 绩 的 影响 ,在 具有 许多 仍 在 学 习 英 语 的 学 生 的 地 区 , 比 在 具有 较 少 的 
英语 学 习 者 前 地 区 的 影响 大 。 在 这 个 例子 中 ,学 生 一 教 病 比 ( 厂 ) 的 下 降 对 考试 成 绩 ( 了 ) 的 
影响 依赖 于 该 地 区 中 的 英语 学 习 者 的 百分比 (KE )。 如 图 6- 一 1 (c) 所 示 , 这 类 总 体 回 归 函 数 
6 $r dR 30 T X, 的 值 。 这 个 第 二 组 方法 在 不 3 节 中 论述 。 

在 本 章 的 模型 中 ,总 体 回归 函数 是 自 变 量 的 非 绕 性 函 孝 ,也 就 是 说 ,条 件 期 望 ECY, IX, 
是 一 个 或 多 个 革 变 量 的 非 线性 浮 数 。 尽 管 它们 是 变量 诗 的 非 线性 阴 数 ,但 这 些 模 型 
却 是 总 体 回 归 模 型 未 知 系数 (或 参数 ) 的 线性 画 数 ,进而 是 第 5 章 中 多 元 回归 模型 的 形式 。 , 
因此 , 非 线性 回归 通 数 的 未 知 系 数 能 够 用 普通 最 小 二 来 法 (OLS) 以 及 第 5 章 中 的 方法 进行 
估计 和 检验 。 

6.1 节 和 6.2 节 介绍 了 具有 单个 自 变 量 回归 情形 下 的 非 线 性 回归 函数 ,而 各 3 节 将 其 
扩展 到 两 个 自 变量 的 情形 。 为 了 简单 起 见 ,65. ] 节 到 6.3 节 中 的 实证 例子 省 略 了 额外 控制 
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注 : 在 图 5--1ta) 中 ,总体 回归 西数 具有 常数 诗 率 。 在 图 6 一 1(b) 中 ,总 体 回归 耳 教 的 计 率 依 炳 于 
X, 4k. 8 6—1(c) t EREE RAAR CT X, 的 值 。 
图 6 一 ! 具有 不 同 斜率 的 总 体 问 归 函数 
变量 。 然 而 在 实际 中 ,通过 引入 控制 变量 ,进而 在 有 控制 遗漏 变量 偏差 的 模型 中 分 析 非 线性 
同 轨 函 教 是 非常 重要 的 。 在 下 .44 节 , 在 学 生 转 征 保持 不 变 的 情况 下 , 当 我 们 进一步 观察 考试 
成 病 与 学 生 一 才 师 比 之 间 可 能 的 非 线 性 关系 时 ,我 们 将 非 线性 回归 函数 和 额外 的 控制 严重 
结合 在 一 起 。 


-6. 1 _ 非 线性 回归 函数 建 模 的 一 般 策 略 ] 





这 节 展 开 介绍 了 非 线性 总 体 回归 函数 建 模 的 一 般 策略 。 在 这 种 策略 中 , 非 线性 模型 是 
作为 多 元 回归 模型 的 扩展 形式 ,因此 可 用 第 5 章 中 的 工具 进行 估计 和 检验 。 我 们 首先 回 到 
加 利 福 尼 亚 州 考试 成 绩 数据 的 例子 中 , 并 考虑 考试 成 绩 与 地 区 收入 之 间 的 关系 。 


6.1.1 考试 成 绩 与 地 区 收入 


在 第 5 章 , 我 们 发 现 学 生 的 经 济 背景 是 解释 标准 化 考试 成 绩 的 一 个 重要 因素 。 在 上 一 章 
的 分 析 中 ,我 们 使 用 了 两 个 经 济 背景 变量 (享受 午餐 补助 计划 的 学 生 百分比 和 享受 收入 援助 计 
划 的 地 区 家 宪 的 百分比 ) 来 测度 地 区 中 来 自 贫 围 家 庭 的 学 生 的 比率 。 另 外 一 个 不 同 的 测度 经 
济 背 景 的 更 广泛 应 用 的 指标 是 学 区 中 的 平均 年 人 均 收 入 ("地 区 收入 ”)。 加 利 福 尼 亚 州 的 数 
据 集中 包含 有 1998 年 当年 以 千 美元 测度 的 地 区 收入 数据 。 该 样本 数据 中 包含 了 一 个 较 宽 范 
围 的 收入 水 平 数据 :对 我 们 样本 中 的 420 个 学 区 而 言 , 学 区 收入 中 位 数 是 13.7( 即 人 均 收 人 
13 700 美 元 ) , 它 从 5.3( 人 均 5 300 美元 ) 变 动 到 55. 3( AF8 55 300 美元 )。 

6 一 2 反映 了 加 利 福 尼 亚 州 数据 集中 一 个 五 年 级 学 生 的 考试 成 绩 与 地 区 收 人 的 散 点 


画 , 同 时 附 训 了 联系 这 两 个 变量 的 普通 最 小 二 乘 回 归 线 。 考 试 成 绩 和 平均 收 人 是 强 正 相关 
的 ,相关 系数 为 0.71。 来 自 富裕 地 区 的 学 生 在 考试 上 的 表现 要 比 来 晶 贷 图 地 区 的 学 生 好 。 
但 这 个 散 点 图 有 一 个 特殊 性 ; 当 收 入 很 低 (10 000 美元 以 下 ) 或 很 高 (40 000 美元 以 上 ) 时 ， 
大 多 数 点 在 普通 最 小 二 乘 回归 线 的 下 方 ,而 当 收入 介 于 15 000 美元 ~30 000 美元 之 间 时 则 
在 回归 线 的 上 方 。 在 考试 成 绩 与 收入 之 间 的 关系 中 似 笠 还 有 一 些 设 有 被 线性 回归 捕 提 到 的 
凸 性 关系 。 

简 而 言 之 ,地 区 收入 与 考试 成 绩 之 间 的 关系 看 上 去 似乎 并 不 是 一 条 直线 ,或 者 确切 地 说 ， 
它 是 非 线性 的 曲线 。 非 线性 函数 是 个 斜率 不 是 常数 的 函数 :如 果 函 数 【(X) 的 斜率 对 于 所 有 的 
值 都 是 相同 的 ,那么 太 X) 是 线性 的 , 伺 如 果 斜 率 依赖 于 X 的 值 ,那么 太 X) 是 非 线性 的 。 

如 果 直 线 不 足以 描述 地 区 收 人 与 考试 成 绩 之 间 的 关系 ,那么 用 什么 来 描述 它们 呢 ” 设 
想 画 一 条 拟 合 图 6 一 2 中 的 点 的 曲线 ,这 条 曲线 对 于 低 的 地 区 收入 将 会 是 陡峭 的 ,而 后 随 着 
地 区 收入 变 高 曲线 将 会 灾 得 平坦 。 数 学 上 ,近似 这 种 曲线 的 一 种 方法 就 是 用 二 次 函数 模型 
来 模拟 这 个 关系 ,也 就 是 说 ,我 们 可 以 将 考试 成 绩 作 为 收入 和 收入 平方 的 函数 来 建 模 。 
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注 : 在 考试 成 绩 和 地 区 收 人 之 间 存 在 正 相关 关系 (相关 系数 =0.71) ,但 线性 OLS 回归 线 不 能 充分 
地 描述 这 两 个 变量 之 亲 的 关系 。 
图 5 一 2 具有 线性 OLS 同 归 函 数 的 考试 成 绩 与 地 区 收入 的 散 点 图 
考试 成 绩 与 收 人 之 闻 关 系 的 二 次 总 体 回 归 模 型 的 数学 表达 式 为 : 
TestScore, = Ë, +B, Income, + Blneome! + u, (6.1) 
其 中 , 房 ,B 和 应 是 系数 ,income, 是 第 i 个 地 区 的 收入 ,ncome! 是 第 i 个 地 区 的 收入 平方 ,而 
u 是 误差 项 ,按照 惯 例 , 它 代表 决定 考试 成 绩 的 所 有 其 他 因素 。 公 式 (5. 1) 被 称 为 二 次 回归 
模型 | quadratic regression model ) ,因为 总 体 回 归 孙 数 E (TestSeore, | Jncome,) = B, + 
B, income, + BIncome! 是 自 变量 Income 的 二 次 函数 。 
如 果 已 知 公式 (6. 1) 中 的 总 体系 数 B,,B, 和 局 ,那么 就 可 以 在 一 个 地 区 的 平均 收入 基础 
上 预测 该 地 区 的 考试 成 绩 。 但 是 这 些 总 体系 数 都 是 未 知 的 ,因此 必须 用 样本 数据 进行 估计 。 
求 出 能 够 最 佳 拟 合 图 6 一 2 中 数据 的 二 次 函数 的 系数 , 怎 大 起 来 可 能 很 难 。 然 而 ,如 果 
将 公式 (6. 1 ) 与 重要 概念 5. 2 中 的 多 元 回归 模型 进行 比较 ,那么 就 会 发 现 ,公式 (6. 1) 实 奈 
上 是 一 种 具有 两 个 回归 因子 的 多 元 回归 模型 ;第 一 个 回归 因子 是 Income, 第 二 个 回归 因子 是 
Income* 。 因 此 ,在 将 回归 因子 定义 为 Income 和 Jaeome 之 后 ,公式 (6.1) 中 的 非 线性 模型 只 








变化 计算 起 来 更 复杂 ,因为 它 依 赖 于 自 变 量 的 值 。 
非 线 性 总 体 辐 归 项 数 的 -一般 表 达 式 * 。 本 章 中 所 考虑 的 非 线性 总 体 回归 模型 如 下 式 : 
Y, =A ks) tl, (6.3) 
其 中 OX X. n X, E ak 3E SS tE [B| A Eñ H {nonlinear regression function) , 它 是 自 变 
ht X:í.X, Aa BJ a| RER ERTER , 是 误差 项 。 例如 ,在 公式 {6.1) 的 二 次 回归 模 
型 中 ,只 有 一 个 白 变 量 ,因此 半 是 Income, 总 体 的 回归 函数 为 了 (Jncome, = Bo + B. income, + 
B. Income 。 

AA SE M E EREHE X. X... X. F Y, 的 条 件 期 望 ,所 以 在 公式 (6.3) 中 ,我 
们 考 虚 了 这 个 条 件 期 望 是 六 ,,X;,,… ,一 个 非 钱 性 沙 数 的 可 能 性 , 即 ECY, Xn Xn 
Xa) SAX Xs, ) ,其 中 下 可 能 是 个 非 线 性 函数 。 如 果 总 体 回 归 函 数 是 线性 的 ,那么 
FX Ny X.) =Ë, +B,X,, + BY¥s, + + BX, ,公式 (6.3) 变 为 重要 概念 5.2 中 的 线性 回 
归 模 型 。 不 过 ,公式 (6. 3) 还 考虑 了 非 线 性 回归 函数 。 

X, 的 变化 对 了 的 敏 应 。 如 5.2 节 中 所 讨论 的 ,在 ,五 保持 不 变 的 情况 下 X, 变化 
AX 对 工 的 效应 就 是 当 自 变量 取 X +AX.,X,, X, 时 了 的 期 望 值 和 当 自 变量 取 A,A, 
… 时 了 的 期 望 值 之 差 。 这 两 个 期 望 值 之 差 ,如 AY 是 在 其 他 变量 X... X, 保持 不 变 的 
情况 下 ,当天 改变 一 定量 AX, 时 ,平均 来 看 在 总 体 中 了 所 发 生 的 变化 。 在 公式 {65.3) 的 非 
线性 回归 模型 中 ,这 对 了 的 效应 为 AY = 成 +AX,.X,, 一 信人) 。 

由 于 回归 函数 六 蚌 未 知 的 ,因此 说 的 变化 对 了 的 总 休 效 应 也 是 未 知 的 。 为 了 估计 总 体 效 
庶 , 首 先 要 估计 总 体 回 妇 函数 。 一 般 地 说 ,将 这 个 估计 函数 表示 为 六 这 种 估计 函数 的 一 个 例子 
是 公式 (6.2) 中 所 知 计 的 二 次 回 旺 丽 数 。Z 的 变化 对 了 的 估计 效应 ( 记 为 A 人 是 当 自 变量 取 
X +AX Xe 值 时 了 的 预测 值 和 当 自 变量 取 XA 值 时 了 的 预测 值 之 差 。 

计算 的 变化 对 了 的 期 望 效应 的 方法 在 重要 概念 6.1 中 总 结 。 

在 考 试 成 绩 和 收入 例子 中 的 应 用 。 根 据 公式 (6.2) 中 所 估计 的 二 次 回归 孙 数 ,与 地 区 
收入 的 1 000 美元 的 变化 相 联系 的 考试 成 绩 的 期 望 变化 是 多 少 ? 由 于 那个 回归 函数 是 二 次 
的 ,因此 这 个 效应 依赖 于 初始 的 地 区 收 人 。 所 以 我 们 考虑 两 种 情况 :地 区 收 人 从 10 增加 到 
11( 妈 人均 收入 从 10 000 美元 增加 到 11 000 美元 ) 和 地 区 收入 从 和 增加 到 41。 

为 了 计算 与 收入 从 10 变化 到 11 有关 的 A 了 ,我 们 可 将 公式 (6.6) 中 的 一 般 表 达 式 应 用 
于 二 次 回归 模型 ,这 样 就 得 到 : 

APCB +Ê, xli +6, x11°) - (ñ, +ñ, x 10 +, < 102) (6.4) 


其 中 ,局 和 应 Æ OLS 佑 计量 。 

公式 {6.4) 第 一 个 括号 中 的 项 是 当 Ineome = 11 时 了 的 预测 值 , 耐 在 第 二 个 括号 中 的 项 
E Income = 10 时 了 的 预测 值 。 这 些 预 调 值 大 用 公式 (6.2) 中 系数 的 0LS 估计 值 进 行 计 算 
的 。 因 此 , 当 Income = 10 时 ,考试 成 绩 的 预测 值 为 607.3 +3.85 x 10 — 0. 0423 x 10 = 
641,57; 4 Income = ]1 时 ,预测 值 为 607.3 +3.85 x 11 -0.0423 x11° =644. 53。 这 两 个 预测 
值 之 差 为 A 了 =644.53 - 641. 57 =2.96 分 ,也 就 是 说 ,平均 收入 为 11 000 美元 的 地 区 与 平均 
收入 为 10 000 美 元 的 地 区 之 闻 的 考试 成 绩 的 预测 车 为 2. 96 分 。 

















在 第 二 种 情况 下 , 当 收 人 从 40 000 美元 变化 到 41 000 美元 时 ,公式 (6.4) 中 的 预测 值 
Z33 A F= (607.3 +3.85 x41 -0.0423 x417) — (607.3 +3.85 x 40 — 0. 0423 x402) = 
694. 04 -的 3. 62 =0. 42 分 。 这 样 , 在 初始 收入 为 10 000 美元 的 情况 下 ,与 1 000 美元 的 收入 
变化 相 联 系 的 预测 考试 成 绩 的 变化 比 初 始 收 人为 可 000 美元 的 情况 下 的 变化 大 (预测 变化 
为 2.96 分 与 0.42 分 ) 。 换 句 话 说 ,图 6 一 3 中 所 估计 的 二 次 回归 函数 的 斜率 在 低 收 入 值 处 
(如 10 000 美元 ) 比 在 较 帘 的 收入 值 处 {如 40 000 美元 ) 陡 峭 。 


重要 概念 6. 1 
在 非 线 性 回归 模型 (6. 3) rh X, 的 变化 对 Y 的 期 望 效 应 

# X, X, 保持 不 变 的 情况 下 ,与 X, 变化 AX, 相 联系 的 了 的 期 望 变化 AY, EE X, 

A 保持 不 变 的 情况 下 ,X 变化 前 后 总 体 回归 函数 值 之 差 ,也 就 是 说 ,了 的 期 望 变化 是 ; 
AY=/f(X +AX X, X.) fO .X,. X.) (6.5) 

这 个 未 知 总 体 差 值 的 鸽 计量, 是 这 丙种 情况 下 的 预测 人 之 差 。 设 玉 X X... X.) 为 基 
于 总 体 回归 函数 的 佑 计量? 的 了 的 预测 值 , 那 么 了 的 预测 变化 为 : 

在 他 = 大 天 +AX X... X) - KX, X, u: ) (6.6) 

EIRAN. X, 的 变化 对 了 的 效应 的 佑 计量, 依赖 于 总 体 回归 函数 的 估计 量 庆 
这 个 估计 量 随 样 本 的 变化 而 不 同 。 因 此 ,估计 效应 中 包含 抽样 误差 。 一 种 量化 与 估计 效应 
有 美的 抽样 不 确定 性 的 方法 ,是 计算 真实 总 体 效 应 的 置信 区 间 。 为 了 计算 真实 总 体 效应 的 
置信 区 间 , 我 们 需要 计算 公式 (6.6) 中 A ?的 标准 误 。 

当 回归 函数 是 线性 的 时 ,很 容易 计算 A 了 的 标准 误 。X, 的 变化 的 估计 效应 为 名 AXi IN 
此 所 估计 的 变化 的 5 锡 的 置信 区 间 是 名 AX, +1.96SE(B)AX,。 

在 本 章 的 非 线性 回归 模型 中 ,A ?的 标准 误 可 用 5. 8 节 中 所 介绍 的 涉及 多 个 系数 的 检验 
单个 约束 条 储 的 工具 进行 计算 。 为 了 具体 说 明 这 种 方法 ,考虑 在 公式 (6.4) 中 与 收入 从 10 
到 11 的 变化 相 联 系 的 考试 成 绩 的 侍 计 变化 , 它 是 A 了 = x (11 -10) +ñ, x (11° = 102) = 
ñ, +21B&。 因 而 ,预测 变化 的 标准 误 为 ; 

ST(A Ý) =SE(B, +218) (6.7) 

因此 ,如 果 我 们 能 够 计算 局 +218. 的 标准 误 ,那么 我 们 就 已 经 计算 出 了 À 了 的 标准 误 。 

使 用 标准 的 回归 软件 可 有 两 种 方法 来 计算 标准 误 ,它们 对 应 于 5.8 节 中 检验 单个 约束 条 件 
对 多 个 系数 的 两 种 方法 0。 

第 一 种 方法 就 是 用 5. 8 节 中 的 "方法 1” ,这 种 方法 就 是 要 计算 检验 假设 启 +218, =0 的 
F gt IA A 区 的 标准 误 由 下 式 给 出 @， 

SE(A f) -ta (6.8) 


当 公式 (6, 8) 应 用 于 公式 (6 2) 中 的 二 次 回归 时 ,检验 假设 房 +21 记 =0 的 正统 计量 是 严 = 





站” 这 丙种 方法 是 用 不 同 的 方式 使 用 回归 软件 来 执行 16. 2 节 中 所 提出 的 防 测 效应 标准 误 的 一 般 表达 式 。 . 
2 AAG. 8) 基 根据 下 统计 量 是 检验 这 个 假设 的 :统计 量 的 平方 推导 出 来 的 , 即 :所 =F le +218,)/SE(B, + 
38.)]2 = [和 多 SECA Py ]? ,进而 解 出 SECA 9) , 


299.94。 由 于 态 作 =2.96, 应 用 公式 (6.8) ,得 出 SE(A f) =2.96//299.94 =0.17, BT, Y 
的 期 望 值 的 变化 的 旺 锡 的 置信 区 间 为 2.% +1.96 x0.17, 即 为 {2.63,3.29)。 

第 二 种 方法 就 是 用 5.8 节 中 的 “方法 2” ,这 种 方法 需要 变换 回归 因子 ,使 得 在 所 变换 的 
回归 中 有 一 个 系数 是 B +218,。 这 个 变换 留 作 练习 ( 见 练习 6.4)。 

在 砂 线 忻 设 定 下 对 系数 解释 的 评论 。 在 第 5 章 的 多 元 回归 模型 中 ,回归 系数 据 有 自然 
的 解释 。 例 如 ,Bi 是 在 保持 其 他 回归 因子 不 变 的 情况 下 ,与 古 的 变化 有 关 的 了 的 期 望 变 
化 。 但 是 ,正如 我 们 已 看 到 的 , 非 线 性 模型 一 般 并 非 如 此 。 也 就 是 说 ,将 公式 (6, 1) PH p, 
看 做 是 在 保持 地 区 收 人 的 平方 不 变 的 情况 下 改变 地 区 收入 所 产生 的 影响 ,这 种 认识 是 没有 ` w. 
多 大 帮助 的 。 这 意味 着 ,在 非 线 性 模型 中 ,回归 函数 最 好 是 通过 画图 和 计算 改变 一 个 或 争 个 ` 
自 变 量 对 了 的 预测 效应 进行 解释 。 


6.1.3 ”用 多 元 回归 建立 非 线性 模型 的 一 般 方法 A 


本 章 中 所 采用 的 建立 非 线 性 回归 函数 模型 的 一 般 方法 包括 五 个 要 素 ， 

1. 识别 可 能 的 非 线性 关系 。 最 好 的 办 法 就 是 利用 经 济 理论 和 你 所 了 解 的 关于 应 用 方 而 
的 知识 ,建议 一 种 可 能 的 非 线性 关系 。 其 至 在 分 析 数 据 之 前 , 先 想 想 联系 了 和 革 的 回归 函 
数 的 斜率 是 否 很 合理 地 依赖 于 的 值 或 其 他 自 变 量 的 值 。 为 什么 会 存在 这 样 的 非 线性 依 
赖 性 ? 建议 一 种 什么 样 的 非 线性 形式 ? 例如 ,考虑 一 下 H 岁 小 学 生 的 班级 ,将 班级 规模 由 
18 人 潮 减 到 17 人 可 能 会 比 由 30 人 前 减 到 29 人 有 更 大 的 影响 ,看 看 这 个 例子 能 给 我 们 什 
么 启示 。 

2. 设 定 一 个 非 线性 函数 并 用 OLS 估计 其 参数 。6 2 3306.3 节 含 有 可 用 OLS 方法 居 计 的 
各 种 不 同 的 非 线性 回归 函数 。 学 民 这 两 节 的 内 容 后 ,你 就 会 理解 这 些 函 数 中 每 个 函数 的 特征 。 

3. 确认 所 确定 的 非 线性 模型 是 否 比 线性 模型 有 所 改进 。 并 不 一 定 因 为 你 想象 的 画 数 是 
非 线性 的 , 它 确实 就 是 非 线性 的 ! 你 必须 在 经 验 的 基础 上 证 明 你 所 建立 的 非 线 性 模型 是 否 
是 适合 的 。 大 多 数 情况 下 ,你 可 以 用 :统计 量 和 已 统计 量 来 检验 总 体 回 归 函 数 是 线性 的 零 
假设 ,对 应 于 它 是非 线性 的 备 择 假设 。 

4. 绘制 所 估计 的 非 线性 回归 函数 。 所 估计 的 回归 函数 是 否 很 好 地 描述 了 数据 的 分 布 ? 
看 一 看 图 6 一 2 和 图 6 一 3 ,这 两 个 图 表明 了 二 次 模型 对 数据 的 拟 合 要 比 线性 模型 好 。 

5. 估计 站 的 变化 对 了 的 效应 。 最 后 一 步 是 利用 重要 概念 6. 1 中 的 方法 ,用 所 估计 的 加 
归 方 程 计算 一 个 或 多 个 回归 因子 三 的 变化 对 了 的 效应 。 


[6.2 单个 自 变量 的 非 线 性 函数 - 


本 节 提 出 了 建立 非 线 性 回归 函数 模型 的 两 种 方法 。 为 了 简单 起 见 ,我 们 逐步 展开 这 些 
只 涉及 一 个 自 变量 的 非 线 性 回 扫 函 数 的 方法 。 不 过 ,在 6.4 节 中 我 们 会 看 到 ,这 些 模型 经 
过 修正 ,就 可 以 包 售 多 个 自 变量 。 

本 节 所 讨论 的 第 一 种 方法 是 多 项 式 回 归 , 这 种 回归 是 上 一 节 中 用 来 建立 考试 成 绩 和 收 
人 之 间 关 系 的 二 次 回归 模型 的 推广 。 第 二 种 方法 使 用 工 和 /或 了 的 对 数 。 尽 管 这 些 方法 是 
分 别 被 提出 来 的 ,但 它们 可 以 组 合 起 来 使 用 。 


6.2.1 多 项 式 
设 定 非 线性 回归 函数 的 一 种 方法 就 是 使 用 的 多 项 式 。 一 般 地 说 , 设 7 表示 回归 中 包 











BJ X 的 最 高 次 寡 。r 次 多 项 式 回 归 模型 polynomial regression model) 为: 

F =B +B X +B X += BA +u (6.9) 
当 r=2 时 ,公式 (6.9) 就 是 6.1 节 中 所 讨论 的 二 次 回归 模型 。 当 "=3 时 ,所 包含 的 的 最 
高 次 圭 紧 下 ,公式 16.9) 被 称 为 三 次 回归 模型 { cubic regression mooel) 。 

争 项 式 回归 模型 与 第 5 章 中 的 多 元 回归 模型 很 相似 ,其 差别 在 于 第 5 章 中 的 回归 因子 
是 不 同 的 自 变 其 ,而 这 里 的 回归 因子 是 同一 个 自 变革 了 的 不 同 次 军 , 即 回归 因子 为 XX ,六 
等 ,因此 ,多 元 回 时 中 所 提出 的 估计 和 推断 的 技术 都 可 以 应 用 在 这 里 ,尤其 是 公式 (6.9) 中 
的 未 知 系数 局 ,B , 8 TAH Y. AX X... X: EHAR OLS 方法 进行 估计 。 

检验 总 体 二 归 函 数 是 线性 的 零 假设 。 如 果 总 体 回 归 冰 数 是 线性 的 ,那么 二 次 项 和 较 嵩 
次 的 项 就 不 会 进入 到 总 体 问 归 函 数 中 。 因 此 ,回归 是 线性 的 零 假 设 ( 融 ) 以 及 它 是 +r 次 多 项 
式 的 备 择 假设 (HH ) 对 应 于 ; 

HB;:B, =0,B =0,…,B, =0;H ;至少 有 一 个 BB 0. =2,… ,rT (6.10) 

总 体 回 归 函 数 是 线性 的 零 假 设 ,对 应 于 它 是 > 次 多 项 式 的 备 择 假 讶 ,可 以 通过 表达 式 
(6. 10) Ë H, 对 H, 的 检验 来 完成 。 由 于 R, 是 个 联合 堆 假 设 , 其 中 对 总 体 多 项 式 回 归 模 型 
的 系数 有 =r -1 个 约束 条 件 , 它 可 以 用 5.7 节 中 所 描述 的 下 统 计量 进 行 检验 。 

应 该 使 用 几 次 多 项 式 ? 也 就 是 说 ,多 项 式 回归 中 应 该 包含 下 的 多 少 次 寺 ” 答案 要 在 灵 
活性 和 统计 精确 床 之 间 进 行 权衡 。 增 加 次 数 r 会 使 回归 函数 拥有 更 大 的 灵活 性 ,并 使 之 与 
数据 模式 更 好 地 相 匹 配 。 一 个 > 次 多 项 式 在 其 图 形 中 的 弯曲 部 分 ( 即 拐点 ) 可 以 达到 r-1 
个 ,但 是 增加 > 意味 着 增加 了 更 多 的 回归 因子 ,这 会 降低 估计 系数 的 精确 度 。 

国 此 ,在 回归 中 包含 多 少 项 的 问题 的 答案 ,就 是 在 非 线性 回归 建 模 中 应 该 包含 足够 多 的 
项 ,但 也 不 能 过 和 多。 不 幸 的 是 ,这 个 答案 在 实践 中 并 没有 多 大 用 处 。 

一 种 较为 实际 的 确定 多 项 式 次 数 的 方法 ,就 是 判断 公式 (6.9) 中 与 7 的 最 大 值 相对 应 的 
系数 是 否 为 零 。 如 果 是 的 话 ,那么 就 可 以 从 回归 中 遇 除 这 些 项 。 这 个 方法 被 称 为 序 贯 很 设 
检验 ,因为 每 个 假设 被 依次 有 序 地 进行 检验 。 序 贯 假设 检验 的 步 又 总 结 如 下 : 

L 选取 7 的 最 大 值 ,并 估计 出 带 有 该 r 次 项 的 多 项 式 回 归 。 

2. 用 ! 统 计量 检验 X' 的 系数 (公式 (6.9) 中 的 8,) 为 等 的 假设 。 如 果 这 个 假设 被 拒绝 ， 
那么 半 “ 应 属于 这 个 回归 ,因此 使 用 7r 次 多 项 式 。 

3. 如果 在 第 2 步 中 你 没有 拒绝 p, =0, 那 么 就 将 从 回归 中 剔除 ,并 继续 估计 r -1 次 
多 项 式 回 归 。 检 验 庆 ' 的 系数 是 否 为 零 。 如 果 拖 绝 ,那么 就 使 用 + -1 次 多 项 式 。 

4， 如 时 在 第 3 步 中 你 没有 拒绝 及-, =0, 那 么 就 继续 这 个 步骤 ,直到 多 项 式 中 最 高 次 上 
的 系数 在 统计 上 是 显著 的 。 

这 种 方法 有 个 缺失 的 成 分 :多 项 式 的 初始 次 数 r。 在 很 多 涉及 经 济 数 据 的 应 用 中 , 非 线 
性 函数 是 平滑 的 , 即 它们 没有 突然 的 跳跃 或 “尖峰 值 "。 如 果 是 这 样 的 话 ,那么 选择 一 个 小 
一 虚 的 多 项 式 的 最 大 阶 数 是 适合 的 ,比如 说 2,3 或 4, 即 第 1 步 具 r=2.r=3 或 r=4 开始 ?。 

在 考试 成 绩 和 地 区 收入 案例 中 的 应 用 。 关 于 地 区 收入 和 考试 成 绩 之 间 关 系 的 三 次 回归 
函数 是 : 


— 
TestSeore = 600.1 + 5.02 Income- 0.096 Ineome2+ 0.00069 jcome ,R=0. 555 (6.11) 
(5.1) (0.71) 《0 029) (0. 00035) 


Income H: iit EA 1.97, IN k, 5 PU RARER ik — s PK 2 RAT tt |H RRE 











选择 r 的 -- 种 不 辣 的 方法 就 是 使 用 Ë 在 第 12 章 * 时 间 序 列 分 析 " 部 分 中 介绍 。 实 际 上 ,信息 准 旭 方 


T 1 “信息 淮 则 ”, 它 
法 和 送 里 从 绷 的 序 员 假 设 检验 方法 经 常会 得 出 艳 似 的 结果 。 


二 次 的 这 一 零 假设 ,在 5 名 的 显著 性 水 平 下 被 拒绝 。 此 外 ,检验 meone 和 income 的 系数 均 
为 字 的 联合 零 假设 的 正统 计量 为 37.7,p 值 小 于 0.01 久 ,因此 对 应 于 回归 孙 数 是 三 次 的 备 
择 假 没 , 它 是 线性 的 零 假设 被 拒绝 。 

多 项 世 回 归 模 型 系 克 的 解 征 。 对 于 多 项 式 问 归 的 系数 ,没有 很 简单 的 解释 。 解 释 多 项 
式 回归 的 最 好 方法 就 是 画 出 所 估计 的 回归 函数 图 形 ,并 计算 出 一 个 或 多 个 式 值 的 变化 对 了 
的 估计 效应 。 


6.2.2 对 数 


设 定 非 线 性 回归 函数 的 男 一 种 方法 就 是 使 用 X 和 /或 了 的 自然 对 数 。 对 数 将 变量 的 绝 
对 变化 转换 成 百分比 变化 ,而 且 许 多 关系 是 用 百分比 变化 来 表示 的 。 下 面 是 一 些 例子 : 

Eo 5 节 研 究 了 男女 大 学 毕业 生 之 间 的 工资 差异 。 在 那个 讨论 中 ,工资 差异 古 用 美元 
来 测度 的 。 可 是 , 当 它们 用 百分比 的 形式 表示 时 ,会 更 易于 比较 不 同 职业 和 不 同时 间 的 工资 
差异 。 

E 在 6.1 节 , 我 们 发 现 地 区 收入 和 考试 成 绩 之 问 是 非 线性 关系 。 者 用 百分比 变化 表示 ， 
这 个 关系 会 是 线性 的 吗 ? 也 就 是 说 ,对 不 同 收入 水 平 而 言 ,地 区 收 和 人 的 1 多 的 变化 一 一 而 不 是 
1 000 美 元 一 一 会 与 考试 成 绩 的 变化 密切 联系 吗 (在 收入 取 不 同 值 时 ,考试 成 绩 几 乎 不 变 }? 

N 在 消费 需求 的 经 济 分 析 中 ,经 常 假设 价格 增长 1 多 会 导致 需求 量 降 低 一 定 的 百分比 。 
由 于 价格 上 涨 1 多 所 导致 的 需求 量 的 百分比 变化 ,被 称 为 价格 弹性 (elasticity) 。 

回归 模型 设 定 为 自然 对 数 形式 ,我 们 可 以 应 用 该 回归 模型 估计 诸如 上 上述 的 百分比 关系 。 
在 介绍 这 些 回归 设 定之 前 ,我 们 复习 一 下 指数 函数 和 自然 对 数 函 数 。 

指数 因数 和 白 然 对 数 。 指 数 函 数 ,与 它 的 反 函 数 一 自 然 对 数 ,在 建立 非 线性 函数 模型 
中 起 着 重要 的 作用 。x 的 指数 函数 { exponential function)} 是 e, 即 e 以 x KERR, RE e 
为 常数 2. 71828… ,指数 函数 也 可 写 为 exp(x) 。 自 然 对 数 { natural logarithm) 是 指数 函数 的 
反 郴 数 , 即 自然 对 数 是 *=ln(e) ,或 *=ln[ exp(z) ] 的 函数 。 自 然 对 数 的 底数 是 。 尽 管 还 
有 其 他 底数 的 对 数 ,如 底数 为 10, 但 本 书 中 我 们 只 考虑 以 。 为 底数 的 对 数 , 即 自然 对 数 , 所 
以 当 我 们 使 用 术语 * 对 数 "时 ,我 们 总 是 指 * 自然 对 数 ”。 

对 数 函 数 y = lnfx) 绘 制 在 图 6 一 4 中 。 注 意 , 对 数 函 数 仅 对 x 取 正 值 时 有 定义 。 对 数 函 数 
的 斜率 开始 时 陡峭 ,而 后 又 变 平 了 (尽管 函数 连续 递增 )。 对 数 函 数 In(x) 的 斜率 是 1/x。 

对 数 函 数 具 有 如 下 有 用 的 性 质 : 


In(1⁄/z) = -ln(x) (6.12) 
In(ax) =l]n(a) +In(z) (6.13) 
In(xZa) =ln(x) —In(a) (6.14) 

In(z°) =aln( x) (6.15) 


HAAT WARA 232 AE AART ARR: M Ax 很 小 时 ,x + 
Ax 的 对 数 与 x 的 对 数 之 差 约 等 于 AxZx , E x 的 百分比 变化 被 100 除 ,也 就 是 说 : 
Ip(x + Az) -mn(s) SE 52548 NB) (6.16) 


这 里 " = "意思 是 “的 等 于 * 。 这 全 近似 的 严密 推导 要 依靠 微 积 分 ,但 却 很 容易 通过 试用 一 些 
x 和 Ax 的 值 加 以 证 明 。 例 如 , 当 xY = 100,Ax =1 时 ,Ax/x = 1/100 =0.01( 1 1%), Inz + 
àx) - ln(x) =In{101) - In(100) =0. 00995 ( Ek 0. 995%), BE, Ax/x( {EA 0. 01) 3E38 32 
JEF ln(x + Az) —In(x) R 0. 00995), H Ar =5 Mf, As/x =5/100 =0. 05, iff ln(x + Az) 
—In(x) =ln(105) -In(100) =0. 04879, 
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ERRAR Y =n (OF Y EER KB X BER, RAF X>0 时 有 定义 , 且 有 斜率 1/X。 
6 一 4 HRAN Y=lní X) 

.个 对 数 四 上 归 模 型 。 有 三 种 可 能 会 用 到 对 数 的 不 同情 况 : 工 通过 取 对 数 来 进行 转换 ,而 
了 不 进行 转换 ;了 被 变换 成 它 的 对 数 ,而 XxX 不 作 转 换 ;XX 和 了 都 被 转换 成 它们 的 对 数 。 在 每 
种 情况 下 回归 系数 的 解释 基 不 同 的 。 我 们 依次 讨论 这 三 种 情况 。 

情 痪 1: 工 让 对 数 ,而 了 不 取 对 数 。 在 这 种 情况 下 , 回 妇 模型 为 : 

Y =ñ, +B lX) +u, ial, n (6.17) 
HT YS XR T X W r H H x RHS 1 A hr ak pa SR Ek x$ RORE ( linear-log 
model) 。 

EREA X 34k 19% ,了 对 应 变化 0.018,。 为 了 弄 明 和 白 这 一 点 ,考虑 总 体 回归 
函数 在 了 变化 AX 的 不 同 取 值 处 之 间 的 差异 ,这 就 是 [B, tAn +A) ] -S +B;ln(X)] 
=B.[In( X+ AX) -In(X)] =A (AXX) ,这 里 最 后 一 步 使 用 了 表达 式 (6. 16) 中 的 近似 结 
果 。 如 果 半 变化 1% ,那么 AXAX=0.01, 因 此 ,在 这 个 模型 中 ,天 变化 1 名 与 了 变化 0.018， 
相对 应 。 

公式 (&. 17) 中 的 回归 模型 与 第 4 章 的 一 元 回归 模型 之 间 的 惟一 区 别 就 是 方程 右边 的 
变量 现在 是 的 对 数 而 不 是 本身。 为 估计 公式 {6. 17) 中 的 系数 B, 和 有 ,首先 要 计算 新 
变量 In(x) ,这 用 电 于 表格 软件 或 统计 软件 很 容易 数 到 。 然 后 ,就 可 用 了 对 In(X,) 的 OLS 
回归 来 千 计 Bo 和 所 ,可 以 用 :统计 量 来 检验 关于 B, 的 假设 ,而 B 的 95 名 的 置信 区 间 可 被 
构造 为 名 +1.968F(Añ,) , 

作为 一 个 例 于 ,让 我 们 回 到 地 区 收 和 信和 考试 成 绩 之 间 的 关系 上 来 。 我 们 用 公式 (6. 17) 
中 的 线性 对 数 设 定 代替 二 次 设 定 ,用 OLS 估计 这 个 回 为 得 到 : 


— 
TestScore = 557.8 + 36.42 ln(řncome) ,RR =0.561 (6.18) 
(38) (1.40) 


根据 公式 (6. 18) ,收入 每 增加 1% ,考试 成 绩 增 加 0. 01 x36. 42 =0. 36 分 。 

为 了 千 计 用 初始 单位 千 美元 (而 非 对 数 ) 测 度 的 下 的 变化 对 工 的 效应 ,我们 可 以 用 重要 
概念 6. 1 中 的 方法 。 例 如 ,平均 收入 10 000 美元 的 地 区 和 平均 收入 11 000 美元 的 地 区 之 间 
考试 成 绩 的 预测 差 是 多 少 ? AY 的 估计 值 是 预测 值 之 差 :.A P = [557.8 +36.42In(11)} - 
[557.8 +36.421n(10)] =36. 42 x [I(11) -In(10)] =3.47。 同 理 , 平 均 收 入 40 000 美元 
的 地 区 和 平均 收入 41 000 美元 的 地 区 之 间 的 预测 善 为 36. 42 x [ln(41) ~In(40)] =0. 90, 


国 此 ,和 一 次 设 定 一样 , 这 个 回归 预测 了 在 贫穷 地 区 收入 增加 t 000 美元 对 考试 成 绩 的 效应 
比 在 富裕 地 区 大 。 

公式 (6. 18) 中 所 估计 的 线性 对 数 回 归 函 数 绘制 在 图 6--5 中 。 由 于 公式 (6. 18) 中 的 回 
时 因子 是 收入 的 自然 对 数 而 不 是 收入 ,因此 所 估计 的 回归 丙 数 不 是 一 条 直线 。 像 图 6 一 3 中 
的 二 次 回归 函数 一 样 , 它 在 开始 时 是 陡峭 的 ,而 随后 对 计较 高 的 收入 水 平 又 变 平 了 。 


720 线性 对 数 回 归 
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关系 。 
图 6 一 5 ”线性 对 数 回归 函数 
情况 2:7 取 对 数 ,和 而 三 不 取 对 数 。 在 这 种 情况 下 ,回归 模型 为 : 
In(F) =B, +B, X, +u, (6.19) 
出 于 了 到 对 数 ,而 了 不 取 对 数 ,因此 这 种 情况 被 称 为 对 数 线 性 模型 [log-linear model} 。 
在 对 数 线性 模型 中 , 革 每 变化 1 个 单位 (AX =1) ,了 对 应 变化 100 x8 0. HT AHA 
这 一 点 ,比较 焉 变化 AX 的 不 同 取 值 处 的 In( 了 的 期 望 值 。 给 定 开 条 件 下 n(Y) 的 期 望 什 为 
I(Y) =Ë tPA, 34 X 为 X+AX 时 ， 由 等 式 ln( Y +AYFY) =P +A (X+ ADAHA. 因 
此 ,这 两 个 期 望 值 之 差 为 In(Y+AY) -In(Y) = [Bo +B1(X+AX)] - (B +B,X) = 有 AT。 然 
而 ,根据 公式 (6. 16) 中 的 近似 ,如 果 B. AX 很 小 ,那么 In(Y +AY) -In (Y) = AY/Y, IX FE, 
AY/Y 二 BLAX。 如 果 AX =1 使 得 了 改变 1 个 单位 ,那么 AYY 改变 po ERAADA E 
化 1 个 单位 与 Y 变 化 100 x 户 色相 对 应 。 
举例 说 明 ,我 们 回 到 3.6 节 的 实证 例子 , 即 大 学 毕业 生 的 年 龄 和 收入 之 间 关 系 的 问题 
上 。 很 多 雇佣 合同 中 明确 规定 ,每 多 服务 一 年 ,工人 会 得 到 在 其 工资 基础 上 的 一 定 百分比 的 
增加 。 这 个 百分比 美 系 表明 可 以 应 用 估计 公式 (6. 19) 中 的 对 数 线性 设 定 , 即 从 总 体 平 均 来 
看 ,年 龄 (XX) 每 增加 一 岁 是 与 收入 (了 的 某 一 恒定 百分比 的 增加 相 联 系 的 。 首 先 要 计算 新 
的 因 变 量 In( Earnings,) ,然后 米 知 系数 B, AA, 可 以 用 in( Earnings,) 对 Age, 回归 的 OLS H 
法 进行 居 计 。 当 使 用 1999 年 当前 入 口 调查 (附录 3.1 中 所 描述 的 数据 ) 中 12 077 个 大 学 毕 
业 生 的 观察 值 来 估计 这 个 关系 时 ,得 到 如 下 的 知 计 方程 ， 


-一 一 人 
In( Earings) = 2.453 + 0.0128 Age,R =0. 0387 (6.20) 
(0.024) (0.0006) 


根据 这 个 回归 ,年龄 每 增加 一 岁 ,收入 预计 增长 1. 28% (0.0128 x100% ) 。 








双 对 数 回归 的 R (0. 577) 比 对 数 线 性 回归 的 屎 (0.497) 高 这 一 点 相 一 致 。 即 使 好 此 , 双 对 
数 设 定 对 数据 的 氢 合 也 不 是 很 好 :在 较 低 的 收入 值 处 ,大 部 分 观察 值 落 在 双 对 数 回归 曲线 的 
下 方 ,而 在 收入 的 中 加 范围 内 ,大 部 分 观察 值 落 在 所 估计 的 回归 函数 的 上 方 。 

三 个 对 数 回归 模型 在 重要 概念 6.2 中 总 结 。 

在 比较 对 数 设 定 时 的 一 个 朵 难 。 哪 一 个 对 数 回 具 模 型 拟 合 数据 最 好 ? 正如 我 们 在 公式 
(6.23) 和 公式 (6.24) 中 所 看 到 的 , 严 可 以 用 来 比较 对 数 线性 模型 和 双 对 数 模型 ,这 里 双 对 
数 模型 怡 巧 有 较 识 的 R. ME, R 可 以 用 米 比 较 公 式 (6, 18) 的 线性 对 数 回 归 和 了 对 开 的 
线性 回归 。 在 考试 成 绩 和 收入 的 回归 中 ,线性 对 数 回 归 模 型 的 六 39 0.561, 而 线性 同 归 的 
R° 为 0.508 ,所 以 ,线性 对 数 模型 拟 合 数据 的 效果 更 好 。 

我 们 如 何 比较 线性 对 数 模型 和 双 对 数 模型 呢 " R° 不 能 用 来 比较 这 两 个 回归 ,因为 它们 
的 因 变 量 是 不 疗 的 (一 个 是 工 , 另 一 个 是 mn( 了 ))。 回 想 一 下 ,站 测度 的 是 因 变 量 的 方差 中 
被 回归 因子 所 解释 的 部 分 。 由 于 双 对 数 模 型 和 线性 对 数 模 型 中 的 因 变量 是 不 同 的 ,因此 比 
较 它们 的 RE 是 没有 意义 的 。 

由 于 这 个 问题 的 存在 ,在 一 个 特定 的 应 用 中 ,最 好 的 方法 就 是 用 经 济 理论 和 你 自己 的 认 
识 或 其 他 专家 对 这 个 问题 的 认识 来 判定 了 取 对 数 是 否 有 意义 。 例 如 ,劳动 经 济 学 家 通常 用 
对 数 来 建立 收入 模型 ,因为 工资 的 比较 ,合同 工资 的 增加 等 等 都 最 自然 地 常 以 百分比 形式 来 
讨论 。 在 建立 考试 成 绩 模型 时 ,以 考试 的 成 绩 分 数 而 不 是 考试 成 绩 分 数 的 百分比 讨论 考试 
结果 ,看 上 去 是 很 自然 的 (至少 对 于 我 们 而 言 ) ,所 以 我 们 集中 讨论 因 变 量 为 考试 成 绩 分 数 
而 不 是 它 的 对 数 的 模型 。 


重要 概念 6.2 
对 数 回归 :三 种 情况 
对 数 可 以 用 来 转换 因 变量 了 、 自 变量 或 同时 转换 y 与 (但 是 它们 必须 都 是 正 数 )。 
表 6 一 ! 归纳 了 这 三 种 情况 以 及 回归 系数 p, 的 解释 。 在 每 种 情况 下 ,B, 可 以 通过 在 对 因 变 
量 和 /或 自 变量 取 对 数 后 ,使 用 OLS 进行 估计 。 


$ 6— 对 数 回归 :三 种 情况 
说 回归 设 epii 
1 Y, =8, +B,]n( X.) + u, XAR ,Y Wipy 238 4k 0. 018, 
2 In(Y.) =É, +B.X. +u, 下 变化 工 个 单位 AT =1) ,了 对 应 变化 1008, % 


3 ln(Y) =pB, +B .In( X.) +u, X Aie ty ,了 对 应 变化 BB 名 , Bit 8, YETAR 
Y aa y aA. WRA Y E BEfyXJ 3 E, BE At R Se 
以 直接 用 来 计算 h 了) 的 预测 值 。 不 过 ,计算 Y 本 身 的 预测 值 则 有 一 些小 的 麻烦 。 
为 了 和 弄 明 和 白 这 一 点 ,考虑 公式 (6. 19) 中 的 对 数 线性 回归 模型 ,并 将 它 重 写 , 重 写 后 的 方 
程 以 了 来 设 定 而 不 是 以 In( 耻 来 设 定 。 为 此 ,对 公式 (6. 19) 的 两 边 都 取 指 数 ,结果 是 : 
Y, =exp(B, +B.X, +u.) = ott n (6.25) 
如 果 独立 分 布 于 多, 那么 给 定式 RIET Y, 的 期 望 值 为 E(Y1X) = E(t ne] = 
PSE e") EEE, Ei EC) =0, 也 有 上 E(e*) 1。 这 样 ,不 能 简单 地 通过 取 色 + B, X, 


KIRKER I BEE Ý, = Ô PUBA Y, 的 合适 的 预测 值 。 由 于 缺少 因子 BE(e*) ,因此 这 
个 预测 值 是 有 偏 的 。 


全 ”这 一 部 分 内 容 更 高深 一 些 , 跳 过 这 一 部 分 不 会 影响 理解 上 的 连续 性 。 








这 个 问题 的 解决 办 法 就 是 估计 因子 E(e*) ,并 且 在 计算 了 的 预测 值 时 使 用 这 个 估计 值 ， 
供 是 这 会 变 得 很 复杂 ,我 们 就 不 再 进 一 SR 

男 一 种 “解决 方法 ”, 也 是 本 书 中 所 采取 的 方法 ,就 是 计算 了 的 对 数 的 预测 值 , 而 不 把 它 
们 转化 为 原来 的 单位 。 实 际 上 ,通常 这 是 可 接受 的 ,因为 当 因 变 量 被 设 定 为 对 数 时 ,整个 分 
析 中 只 用 对 数 设 定 ( 和 相关 的 百分比 解释 ) 通 常 是 最 自然 的 。 


6.2.3 ”考试 成 绩 和 地 区 收入 的 多 项 式 模型 和 对 数 模型 


实际 上 ,经 济 理论 或 专家 的 判断 可 能 会 提出 一 个 函数 形式 来 使 用 ,但 是 最 终 总 体 回 归 函 
数 的 真实 形式 却 是 未 知 的 。 央 此 ,实际 上 拟 合 非 线性 函数 必须 判定 哪 一 种 方法 或 方法 的 组 
合 效果 最 好 。 和 作为 一 个 例子 ,我 们 来 比较 地 区 收入 和 考试 成 绩 之 同 关 系 的 对 数 模 型 和 和 多 项 
REN, 
多 项 式 役 定 。 我 们 考虑 用 Icome H- KECARGIDAMZKEAAG. 11) ) 所 设 
定 的 两 个 多 项 式 模 型 。 因 为 公式 (6. 11) 中 meom 的 系数 在 5 名 的 水 平 下 是 显著 的 ,三 次 设 
定 比 二 次 设 定 有 所 改进 ,所 以 我 们 选择 三 次 模型 作为 首选 的 多 项 式 设 定 。 
ARDE. 公式 (6. 18) 中 的 对 数 设 定 看 上 去 为 数据 提供 了 很 好 的 拟 合 ,但 是 我 们 没有 
对 其 进行 正式 检验 。 一 种 检验 方法 就 是 用 收入 对 数 的 更 高 次 冠 来 扩展 这 个 模型 。 如 果 增 如 
的 项 在 统计 上 并 不 是 异 于 0 的 ,那么 我 们 可 以 得 唱 结 论 :相对 于 对 数 多 项 式 沙 数 ,公式 
(6. 18) 中 的 设 定 不 能 被 拒绝 ,在 这 个 意义 上 说 它 是 充分 的 。 困 此 ,所 估计 的 三 次 回归 (用 收 
人 对 数 的 等 来 设 定 ) 为 
—— 
TestŠcore = 486.1 + 113. 4 Jiaeome) - 26. ° [In( Income) |° + 
(79.4) (87.9 (31. 
3.06 (hen, =0. 560 (6.26) 


(3.74) 
三 次 项 系数 的 :统计 量 为 0.818, 因 此 真实 系数 为 零 的 零 假设 在 10 旬 的 显著 性 水 平 下 


不 能 被 拒绝 。 检 验 二 次 项 和 三 次 项 系数 均 为 零 的 联合 假设 的 下 统计 量 为 0.44,p 值 为 
0.64, 所 以 这 个 联合 零 假设 在 10 间 的 显著 性 水 平 下 不 能 被 拒绝 。 因 而 ,公式 (6.26) 中 的 三 
次 对 数 模型 并 没有 比 公 式 (6. 18) 中 的 收入 对 数 的 线性 模型 提供 一 个 统计 上 更 显著 的 改进 。 

比较 二 次 设 定 和 线性 对 数 设 定 。 图 6 一 7 绘制 了 来 自 公 式 (6.11) 的 三 次 设 定 和 公式 
(6. 18) 的 线性 对 数 设 定 所 估计 的 回归 函数 的 图 形 。 这 两 个 估计 的 回归 冰 数 是 非常 相似 的 。 
比较 这 两 个 设 定 的 一 个 统计 工具 是 R, WREAK RE 为 0.561, 而 三 次 回归 的 局 为 
0. 555。 由 于 根据 天 大 小 判断 ,对 数 设 定 稍 有 优势 ,并 且 由 于 这 个 设 定 不 需要 用 收入 对 数 的 
较 高 次 多 项 式 拟 合 这 些 数 据 , 因 此 我 们 采用 公式 (6. 18) 中 的 对 数 设 定 。 


-6. 3 变量 之 间 的 交互 作用 - 


在 本 章 的 引言 中 ,我 们 想 知道 在 很 多 学 生 仍 在 学 习 英 语 的 地 区 ,降低 学 生 一 教师 比 对 考 
试 成 绩 的 影响 是 否 比 在 很 少 学 生 仍 在 学 习 英语 的 地 区 更 大 。 例 如 ,如 果 仍 在 学 习 美 语 的 学 
生 个 别 地 受益 于 一 对 一 的 或 小 范围 的 教学 指导 ,这 种 情况 可 能 就 会 出 现 。 如 果 是 这 样 的 话 ， 
一 个 地 区 有 很 多 的 英语 学 习 者 ,将 会 与 学 生 一 教师 比 的 变化 按 以 下 的 方式 发 生 交互 作用 , 即 
学 生 一 教师 比 的 变化 对 考试 成 绩 的 影响 依赖 于 学 生 中 英语 学 习 者 的 比率 。 

本 节 解 释 如 何 将 两 个 自 变量 之 间 的 这 种 交互 作用 体现 到 多 元 回归 模型 中 。 学 生 一 教师 
比 与 英语 学 习 者 的 比率 之 问 可 能 的 交互 作用 ,就 是 说 明 一 个 自 变量 的 变化 对 了 的 效应 依赖 
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注 :在 这 个 样本 申 ,所 估计 的 三 次 回归 函数 (公式 (6.11) ) 和 所 估计 的 线性 对 数 回归 函数 (公式 
(6. 11)) 几乎 是 相同 的 。 
图 6 一 7 tts ER a= Ese 
于 另 一 个 自 变量 的 值 的 一 个 一 般 性 的 例子 。 我 们 考虑 三 种 情况 ;两 个 自 变量 都 是 二 元 的 ;一 
个 是 二 元 的 ,而 另 一 个 是 连续 的 ;两 个 变量 都 是 连续 的 。 


6.3.1 两 个 二 元 变量 之 间 的 交互 作用 
考虑 对 数 收 入 (了 ,这 里 了 =ln(Earnings,)) 对 两 个 二 元 变量 一 一 个 人 的 性 别 (D, ,如果 
第 i 个 为 女性 ,那么 D. =1) 和 他 {她 ) 是 否 有 大 学 学 历 (D, ,如 果 第 i 个 人 大 学 毕业 ,那么 
D, =1) 的 总 体 回 归 。Y, 对 这 两 个 二 元 变量 的 总 体 线 性 回归 是 ; 
Y =ñ, +B,P,, + B,D, +u, (6.27) 
在 这 个 间 归 模型 中 ,8, 是 在 保持 教育 年 限 不 变 的 情况 下 ,女性 对 对 数 收入 的 效应 ,58: 是 在 保 
持 性 别 不 变 的 情况 下 ,有 大 学 学 历 对 对 数 收 入 的 效应 。 
公式 {6.27) 中 的 设 定 有 个 重要 的 缺陷 :在 保持 性 别 不 变 的 情况 下 ,这 个 设 定 中 具有 大 
学 学 历 的 效应 对 于 男性 和 女性 而 言 都 是 相同 的 。 然 而 ,没有 理由 认为 一 定 会 这 样 。 用 数学 
语言 表述 ,在 也 ,保持 不 变 的 情况 下 ,上 户 ,对 工 的 效应 可 能 会 依赖 于 杞 ,的 值 。 换 名 话说 ,在 性 
别 与 有 大 学 学 历 之 间 可 能 存在 交互 作用 ,使 得 学 历 在 人 才 市 场 上 的 价值 对 于 男性 和 女性 而 
言 是 不 同 的 。 
尽管 公式 (6. 27) 中 的 设 定 设 有 考虑 性 别 与 获取 大 学 学 历 之 间 的 这 种 交互 作用 ,但 很 容 
易 通 过 修正 方程 的 设 定 使 方程 考虑 这 种 交互 作用 , 即 通过 引 人 另 一 个 回归 因子 一 一 两 个 二 
元 变量 之 积 D, x D, 的 方式 来 实现 ,其 相应 的 回归 方程 是 ; 
Y, = +B.D,, +B,D, +B, CD, x D,,) +u, (6.28) 
上 式 中 新 的 回归 因子 , 即 乘积 D, x D, ,被 称 为 变 互 作用 项 (interaction term) ,或 交互 作用 
回归 因子 {interaction regressor) ,而 公式 (6. 28) 中 的 总 体 回归 模型 被 称 为 二 元 变量 的 交互 
作用 回归 模型 (interaction regression model) 。 
公式 (6. 28) 中 的 交互 作用 项 允许 具有 大 学 学 历 (将 DMA Da =0 变化 到 D, =1) 对 对 数 
收入 ( 工 ) 的 剖 体 效应 依赖 于 性 别 (已 ,) 的 变化 。 为 了 在 数学 上 证 明 这 一 点 ,利用 重要 概念 
6.1 中 所 给 出 的 一 般 方法 来 计算 DB, 的 变化 的 总 体 效 应 。 第 一 步 ,在 给 定 D, 的 值 的 情况 下 ， 
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问 截 虑 相同 ， 斜 率 不 同 


福 :二 元 变革 和 连续 变量 的 交互 作用 可 能 会 得 到 三 种 不 同 的 总 体 回归 函数 : 
(a)Bo + 已 于 + 局 站 考虑 了 不 同 的 截 距 ,但 具有 相同 的 斜率 ; 
(bA +AA +BB +A YD) 考虑 了 不 同 的 截 虹 和 不 同 的 斜率 ; 
《cjBo +BX+B( 和 xDD) 考 虑 了 相同 的 截 距 , 但 具有 不 同 的 笠 率 。 
图 6 一 8 使 用 二 元 变量 和 连续 变量 的 回归 函数 
在 图 6 一 8(a) 中 ,两 条 回归 直线 的 不 同 之 处 只 是 它们 的 截 距 不 同 。 相 应 的 总 体 回归 模 
型 是 : 





Y =Á, +B. X, +B,D, +u, (6.31) 
Pake AI 2kaBy 3 u EB SA k IP] 83k 3 X, 和 p, 线性 的 函数 。 当 D, =0 时 ， 
总 体 回归 函数 是 Bu + BX,, 因 此 , 截 距 是 B, ,斜率 是 B,。 当 D. = 1 时 ,总 体 回归 阔 数 是 B + 
BX, +B: RIE, SEENE p ,但 截 距 是 局 +86,。 所 以 ,如 图 6 一 8(a) 所 示 ,B, 是 两 条 回归 线 
的 截 只 之 差 。 根 据 收入 的 例子 所 述 ,B, 是 在 保持 大 学 学 历 状态 不 变 的 情况 下 ,工龄 每 增加 
一 年 对 对 数 收 和 人 的 效应 ;而 8, 是 在 保持 工龄 不 变 的 情况 下 ,大 学 学 历 对 对 数 收入 的 效应 。 
在 这 个 设 定 中 ,工龄 增加 一 年 的 效应 对 大 学 毕业 生 和 非 大 学 毕业 生 都 是 一 样 的 ,也 就 是 说 ， 
图 6 一 8(a) 中 的 两 条 直线 具有 相同 的 斜率 。 

在 图 6 一 8(b) 中 ,两 条 直线 具有 不 同 的 斜率 和 截 忠 。 不 同 的 斜率 使 得 工龄 增加 一 年 的 
效应 对 大 学 毕业 生 和 非 大 学 毕业 生 而 言 有 所 差异 。 为 了 考虑 不 同 的 斜率 ,添加 一 个 交互 作 
用 项 到 公式 (6. 31) 中 ; 

Y =A +X +D +A x D.) +u, (6.32) 
其 中 ,XX xD. 是 个 新 的 变量 。 为 了 解释 这 个 回归 的 系数 ,应 用 重要 概念 6. 3 中 的 方法 。 应 
用 该 方法 我 们 会 发 现 , 如果 D, =0, 邦 么 总 体 回 归 耳 数 是 8。+ BX,, 人 得 如 果 D, =1, 那 么 总 体 
回归 函数 是 (Bo +8) + (8, +B;)X,。 因 此 ,如 图 6 一 8(b) 所 示 , 这 个 设 定 考 虚 到 了 联系 了 
5 X, (Ká D, 的 值 ) 的 两 个 不 同 的 总 体 回归 函数 。 这 两 个 设 定 的 截 距 之 差 是 B, ,斜率 之 








和 截 距 都 相同 的 联合 检验 ,但 是 使 用 t 统 计量 对 单个 假设 的 检验 却 没有 拒绝 。 出 现 这 种 情 
况 的 原因 是 回归 因子 HELM STR x HEL 之 间 是 高 度 相关 的 。 这 导致 单个 系数 有 很 大 的 标 
准 误 。 即 使 这 样 ,过 断定 哪个 系数 是 非 零 的 也 古 不 可 能 的 ,但 也 有 相当 强 的 证 据 拒绝 系数 均 
为 零 的 假设 。 

第 四 ,检验 学生 一 教师 比 不 进入 这 个 模型 设 定 ”的 假设 ,可 以 通过 计算 STR 和 交互 项 
的 系数 都 为 零 的 联合 假设 的 到 统计 量 来 完成 。 这 个 卫 统 计量 是 5. 64,p 值 为 0.004。 因 而 ， 
学 生 一 教师 比 的 系数 在 1 名 的 显著 性 水 平 下 在 统计 上 是 显著 的 。 


重要 概念 6.4 


二 元 变量 和 连续 变量 之 间 的 交互 作用 
通过 使 用 交互 作用 项 谍 x ,联系 了 和 连续 变量 X, 之 间 的 总 体 回归 直线 可 能 会 有 个 
依赖 于 二 元 变量 D, 的 斜率 。 这 有 三 种 可 能 情况 ; 
1. 截 距 不 间 ,斜率 相同 ( 见 图 6 一 8(a) ) : 
Y, = 高 + 向 天 +#,D, +u, 
2. 截 距 和 斜率 都 不 同 ( 见 图 6 一 8(b)); 
Y, =f +8,5, +B,D, +B, (KE x D,) +u, 


3. MEHA, AERA RE 6—8(c)): 
Y =B +A X, +B,(X xD) +u, 


6.3.3 两 个 连续 变量 之 间 的 交互 作用 


现在 假设 两 个 自 变量 (天 .和 总 ) 都 是 连续 的 。 一 个 例子 是 ,了 表示 第 i 个 工人 的 对 数 
收入 , 互 ,表示 他 (或 她 ) 的 工龄 ,而 互 ,表示 他 (或 她 ) 的 上 学 年 数 。 如 果 总 体 回 归 函 数 是 线性 
的 ,那么 工龄 增加 一 年 对 工资 的 效应 不 依 束 于 受 教育 的 年 数 ,成 者 说 ,增加 一 年 的 教育 对 工 
资 的 效应 不 依赖 于 工龄 。 然 而 ,实际 上 这 两 个 变量 之 间 可 能 存在 交互 作用 ,使 得 工龄 增加 一 
年 对 工资 的 效应 依赖 于 受 教育 的 年 数 。 这 种 交互 作用 可 以 通过 用 交互 作用 项 X,, 15 x, =L 
扩展 线性 回归 模型 来 建 模 ， 

Y. =f, +8,X,, +B,X, +B, (X,, x X, ) +u, (6.35) 

交互 作用 项 允许 而 的 单位 变化 的 效应 依赖 于 妈 。 为 了 型 明白 这 一 点 ,应 用 重要 概念 

6. 1 中 计算 非 线 性 回归 模型 效应 的 一 般 方法 。 公 式 (6. 35) 中 的 交互 作用 回归 函数 所 计算 的 

公式 (6.6) 中 的 差分 为 AY = (8, +B,X,) AX, ( 见 练习 6.5(a))。 因 此 ,在 保持 X, 不 变 的 情 
WF , 的 变化 对 了 的 效应 为 : 

rqa +8% (6.36) 


它 依 赖 于 X. 。 例 如 ,在 上 述 收 人 的 例子 中 ,如 果 房 是 正 的 ,那么 工人 所 受到 的 教育 每 增加 
一 年 ,工龄 增加 一 年 对 对 数 收入 的 效应 会 以 数量 记 增加 。 
一 般 兴 趣 框 


对 经 济 学 杂志 的 需求 
专业 经 济 学 家 们 跟踪 其 专业 领域 的 最 新 研究 。 经 济 学 中 的 大 多 数 近期 研究 成 果 首 先 乔 
登 在 经 济 学 杂志 上 ,所 以 经 济 学 家 们 或 他 们 的 图 书馆 都 订阅 经 济 学 杂志 。 
图 书馆 对 经 济 学 杂志 的 需求 弹性 有 多 大 呢 ? 为 了 求 出 这 个 弹性 ,我 们 使 用 2000 年 180 














b. 


种 经 济 学 杂志 的 数据 ,分 析 了 美国 图 书馆 订阅 杂志 的 数量 (了) 与 订阅 价格 之 间 的 关系 。 因 
为 杂志 产品 并 不 只 荐 印刷 过 的 纸张 而 已 ,而 是 杂志 所 包含 的 思想 ,所 以 杂志 的 价格 当然 不 能 
用 每 年 的 价值 或 每 现 的 价值 测度 ,而 应 该 用 每 个 思想 的 价值 来 测度 。 虽 然 我 们 不 能 直接 测 
度 “ 思 想 ” ,但 是 一 个 比较 好 的 间接 测度 就 是 一 本 杂志 中 的 论文 随后 被 其 他 研究 人 员 所 引用 
的 次 数 。 因 此 ,我 们 把 杂志 中 “每 条 被 引用 信息 的 价格 "作为 该 杂 寺 的 价格 测度 。 这 个 价格 
范围 非常 大 ,每 条 引用 从 0.5 美 分 人 《美国 经 济 评论 》) 到 20 美 分 或 更 多 。 一 些 杂 志 的 每 条 
引用 价格 是 很 昂贵 的 ,因为 它们 很 少 被 引用 ,另外 一 些 杂 志 则 因为 每 年 图 书馆 订阅 价格 很 高 
而 变 得 很 贵 :2000 年 ,一 个 图 书馆 订阅 《经 济 计量 学 杂志 》 大 约 要 花费 1 900 美元 ,是 订立 
《美国 经 济 评论 》 具 志 价 格 的 各 售 ! 

因为 我 们 感 兴趣 的 是 合计 其 弹性 ,所 以 我 们 使 用 双 对 数 设 定 ( 见 重要 概念 6.2)。 图 
6 一 9(a) 和 图 6 一 9(b) 中 的 散 点 图 为 这 种 转换 提供 了 经 验 支 持 。 因 为 一 些 年 代 最 久 的 和 最 
有 声望 的 杂志 每 条 被 引用 信息 的 价格 是 最 便宜 的 ,所 以 对 数 需 求 量 对 对 数 价 格 的 回归 可 能 
会 存在 遗 测 变 量 偏 差 。 因 此 我 们 的 回归 中 包括 两 个 控制 变量 ,杂志 年 龄 的 对 数 和 每 年 该 条 
志 上 知名 人 物 数 的 对 数 。 

订阅 数量 订阅 数量 的 对 数 
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注 : 对 于 2000 年 的 180 家 经 济 学 杂志 而 言 ,如 图 6 一 9(a) 所 示 , 在 美国 图 书馆 订阅 数量 (需求 量 ) 和 
每 条 被 引用 信息 的 图 书馆 价格 (价格 ) 之 同 存在 一 个 非 线性 的 反比 例 关 系 。 但 如 图 6 一 9(b) 所 示 , 对 数 
需求 芋 和 对 数 价格 之 间 的 关系 看 上 去 是 近似 线性 的 。 胃 6 -9(c) 表 明了 对 新 (4ee =5) 杂志 的 需求 比 对 
(Age = 中 ) 杂 志 的 需求 更 富 弹 性 。 
图 6 一 9 ”经 济 学 杂志 的 图 书馆 订阅 数量 和 价格 


表 6 一 2 经 济 学 杂志 需求 的 估计 量 
央 变 量 :2000 年 美国 图 书馆 的 订阅 数量 的 对 数 ;180 个 观测 值 


























el} H F (1) {2} 3) (4) 
]n( Price per citation) - 0.533" * - 0.408 ' ` -0, 961 `" - 0.899 " ° 
(0.034) (0.044) (0. 160) (0.145) 
[ in( Price per citation) ]* 0.017 
(0.025) 
[In( Price per citation) ]? 0.0037 
(0.0055) 
In( Age) 0. 424 ' ° 0.373 0.374 ` ° 
(0.119) (0.118) (0. 118) 
In( Age) x In( Price per citation) 0. 156 * * 0.141" ° 
(0.052) (0.040) 
In( Charaeters + 1 000 000) 0. 206 * 0.235 ' 0.229" 
(0.098) (0.098) (0.096) 
4.77" " 3.21" 3.41" 3.43 ° 
截 距 项 (0.055) (0. 385 (0.38) (0.38) 
天 统计 量 和 总 插 性 统计 最 
检验 二 次 项 和 三 次 项 系数 的 0.25 
严 统 计量 (p 值 ) (0.779) 
SER 0.750 0, 705 0.691 0. 688 
E 0.555 0.607 0.622 0.626 


注 :统计 量 检验 [ln( Price per citation) ] 和 [ln( Price per citation) ]" 8) 8 32 FHR. ERAF 
方 的 括号 中 给 出 了 标准 误 , 严 统计 量 下 方 的 括号 中 给 出 了 了 值 。 单 个 系数 在 "5 多 的 水 平 或 是 “1 名 的 水 平 
下 是 显著 的 。 

回归 结果 总 结 在 表 6 一 2 中 。 表 中 的 结果 使 我 们 得 出 如 下 结论 ( 看 看 你 是 否 能 够 在 表 
中 找到 这 些 结论 的 根据 ) : 

1. 对 较 老 杂 志 的 需求 弹性 比 对 较 新 杂志 的 需求 弹性 小 ; 

2. 表 6 一 2 中 的 证 据 支 持 价 格 对 数 的 线性 函数 ,而 不 是 价格 对 数 的 三 次 函数 ; 

3. 在 价格 和 杂志 年 龄 保持 不 变 的 情况 下 ,具有 更 多 知名 人 物 的 杂志 需求 量 更 大 。 

那么 ,对 经 济 学 杂志 的 需求 弹性 是 多 少 昵 ? 它 依赖 于 杂志 的 年 龄 。 有 80 年 历史 的 老 杂 
志和 有 5 年 历史 的 新 杂志 的 需求 曲线 被 添加 到 图 6—9 (c) 的 散 点 图 中 ;对 较 老 杂 志 的 需求 
弹性 是 -0.28(5E =0. 06) ,而 对 较 新 杂志 的 需求 弹性 是 —0.67(SE =0. 08)。 

对 经 济 学 杂志 的 需求 非常 缺乏 弹性 ;需求 对 价格 非常 不 敏感 ,尤其 对 较 老 的 杂志 来 说 。 
对 图 书馆 而 言 ,收藏 手边 最 新 的 研究 是 必需 品 ,而 不 是 奢侈 品 。 通 过 比较 ,专家 估计 烟 的 需 














求 弹性 是 在 -0. 3 到 -0.5 之 间 。 经 济 学 杂志 看 上 去 和 香烟 一 样 让 人 上 瘾 ,但 它 对 健康 更 
EAG 


# X, 保持 不 变 时 ,相似 的 计算 表明 了 总 变化 AX, 对 了 的 效应 是 Ar- =(B,+B,X,). 


将 这 两 个 效应 放 在 一 起 , 麦 明 交叉 项 的 系数 应 BE: X, 和 总 都 增加 1 个 单位 的 效应 , 它 
比 只 增加 工 个 单位 的 互 和 只 增加 1 个 单位 的 的 歼 应 之 和 还 要 大 。 也 就 是 说 ,如 果 半 变 
化 At 和 变化 Am, 那么 了 的 期 望 变化 为 AY = (8, +B,X,) AX, + (B, + B,X, ) AX, + 
BAX AK, (练习 6.5(c))。 第 一 项 是 在 X, 保持 不 变 的 情况 下 ,变化 X, 的 效应 ;第 二 项 是 在 
X, 保持 不 变 的 情况 下 , WE X, 的 效应 ;而 最 后 一 项 BAT AX, 是 变化 ft X, 的 额外 效应 : 

两 个 变量 之 间 的 交互 作用 在 重要 概念 6.5 中 总 结 。 

妆 交 互 作用 与 对 数 转 换 组 合 在 一 起 时 ,它们 可 被 用 来 估计 价格 弹性 ,这 时 价格 弹性 依赖 
于 商品 的 特征 ( 见 本 章 一 般 兴 趣 框 中 的 例子 ) 。 

在 学 咎 一 教师 比 和 英语 学 习 者 的 自分 比 案例 中 的 应 用 : 前 面 的 例子 中 考虑 了 学 生 一 教 
师 比 和 一 个 表示 英语 学 习 者 的 百分比 大 小 的 二 元 变量 之 间 的 变 互 作用 。 研 究 这 个 交互 作用 
的 另 一 种 不 同 的 方法 ,是 检验 学 生 一 教师 出 与 英语 学 习 者 的 百分比 (Per 不 ) 这 个 连续 变 基 
之 间 的 交互 作用 。 所 估计 的 交互 回归 方程 为 : 


— T 
TesiScore = 686.3 - 1.12 STR- 0.67 PaEL+ 0.0012 (STR x PaEL) R: =0.422 (6.37) 
(IE 8) (0.59) (90.37) (0,019) 


当 英 语 学 习 者 的 百分比 取 其 中 位 数 ( ParEL =8.85) 时 ,考试 成 绩 和 学 生 一 教师 比 之 间 关 
系 的 估计 直线 方程 的 斜率 为 -1.11( -1.12 +0. 0012 x8. 85)。 当 英语 学 习 者 的 百分比 取 其 
第 ?5 位 百 分 位 数 { PctEL =23.0) 时 ,这 条 估计 的 直线 会 变 得 更 平坦 ,斜率 为 -1.09( -1.12 
+0.0012 x23.0)。 也 就 是 说 ,对 一 个 英语 学 习 者 的 百分比 为 8. 85 免 的 地 区 面 言 , 学 生 一 教 
师 比 减少 1 个 单位 的 估计 效应 是 使 考试 成 绩 增 加 1. 11 分 ,但 是 对 一 个 英语 学 习 者 的 百分比 
为 23, 0% 的 地 区 而 言 ,学 生 一 教师 比 减少 1 个 单位 预计 只 会 使 考试 成 绩 增加 L 09 分 。 可 
是 ,这 些 佑 计 的 效应 之 善 在 统计 上 并 不 显著 :检验 交叉 项 的 系数 是 否 为 零 的 ! 统 计量 为 上 = 
0.0012/0.019 =0.06, 它 在 10% 的 水 平 下 不 显著 。 


重要 概念 6.5 





多 元 回归 中 的 交互 作用 

两 个 自 变 量 X, 和 X, 之 间 的 交叉 项 是 它们 之 积  x 琅 。 方 程 中 包括 这 个 交叉 项 ,允许 
X, 的 变化 对 了 的 效应 依赖 于 X, 的 值 ,反之 ,允许 X, 的 变化 对 了 的 效应 依赖 于 X, 的 值 。 

X, xX, 的 系数 是 也 fi X, 每 增加 1 个 单位 的 效应, 它 比 只 改变 个 单位 的 马 和 只 改变 
1 个 单位 的 的 效应 之 和 大 。 无 论 X, 和 /或 X, 是 连续 变量 还 是 二 元 变量 ,这 个 结论 都 
成 立 。 

为 了 使 讨论 集中 在 非 线性 模型 上 ,我 们 在 6.1 节 ~6.3 节 的 设 定 讨论 中 排除 了 诸如 学 
生 经 济 背景 等 额外 的 控制 变量 ,因此 ,可 以 证 明 这 些 结果 受 近 漏 变量 偏差 的 影响 。 为 了 得 到 
关于 降低 学 生 一 教师 比 对 考试 成 绩 的 效应 的 实质 性 的 结论 ,必须 用 控制 变量 来 扩展 这 些 非 
线性 设 定 ,这 就 是 我 们 现在 所 要 转 人 的 一 个 练习 。 
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表 6 一 3 考试 成 绩 的 非 线 性 回归 模型 
因 变 量 : 地 区 内 的 平均 考试 成 线 1420 个 观察 什 
HAN f. (n 121 13j (4) (51 (8) 17: 
学 后 一 教师 比 (STR) aon on" 09 L A 8207 Sa 
(0 27) (0.26) (0 59) (034) (48) (3) C (2526) 
sm I ú -3427 AR a 
(25) (1.44) (1.27) 
STR aats -00577 06077 
(0.021) (0.024) (0.021) 
英语 学 习 者 的 百分比 012 ”16 -0 166° 
{0033) (0.034) (0.034) 
IB 628 8 3rik210%° 56 350 -54° Bi6.i 
(ZERE HEL) (19.51) (80) (LO (3277) 
HEL x STR -12 -0.58 -123.3° 
(0.97) (0.530) (30.2) 
MEL x STR? 6.12 ° 
(LH) 
HEE x STR? -0.101 7 
(0 M3) 
享有 午餐 补助 -站 5 ° 0.308" ° -041147 -0 4 7 -04187 D dO" ° 
的 学 生 的 百 分 出 (0.024) (0.033) (0.029) (0.009) (0.029) (0.033) 
地 区 平均 收入 11,57** BR LBO Me S 
(对 数 ) {1.8]) (1.80) (1.78) (1.78) (1.81) 
RE AI 658.6 682°" 653.6" 2520 122.3 w š 
(5,6) (8.6) (IL9) (99) (1639) (185.5) C (165.7) 
联合 假设 移 F SH wp fA 
(a) 所 有 SIR EE 5.64 59 Jl 4% 5.91 
和 交叉 项 =0 {0.004) — (0.003) (<000) (<000 — (00) 
(b)STR2 STR'-0 617 581 5.9% 
(<Ü0 (000) (003) 
(e) IREL x STR MEL x STR? 20 
BELxSTR) =Ù (0 06) 
SER 9.08 8.64 15.88 8.63 8.56 855 8.57 
m 0.75 0.794 0.305 0.795 0798 0.79 0. 998 





注 : 这 些 回 归 是 用 附录 4. 1 中 所 描述 的 加 利 福 尼 亚 州 K 一 8 校区 的 数据 来 知 计 的 。 在 系数 下 面 的 括号 
给 出 了 标准 误 , 在 了 统计 量 下 面 的 括号 给 了 p 值 。 单个 季 数 在 ' 5 免 或 ** 1% 的 显著 性 水 平 下 在 统计 上 是 


显著 的 。 


之 间 的 差异 只 反 蜡 了 这 些 具 有 很 低 的 学 生 一 教师 比 的 极 少数 地 区 的 差异 。 央 此 ,根据 图 
6 一 11 我 们 得 出 结论 ;对 于 我 们 所 拥有 的 数据 所 反映 的 学 生 一 教师 比 的 数值 范围 来 说 ,学 生 
一 教师 比 的 变化 对 考试 成 绩 的 效应 不 依赖 于 英语 学 习 者 的 百分比 。 
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学 生 一 教师 比 
注 ; 佐 英语 学 习 者 百分比 地 区 { 琴 氏 =0) 用 其 色 的 点 表示 ,而 MEL =1 的 地 区 用 彩色 的 点 表示 ”对 
于 17 志 STRS<23 而 言 ,来 自 表 6 一 3 中 第 (6) 列 的 下 好 =] 的 三 次 回归 函数 大 约 比 HEL =0 的 二 次 回归 
函数 低 10 分 ,但 在 其 他 情况 下 ,这 两 个 函数 在 这 个 范围 内 有 根 似 的 形状 和 射 率 。 对 于 很 大 和 很 小 的 
STR 值 而 言 ,回归 明 数 的 斜率 差异 很 大 ,但 这 里 只 有 极 少数 的 观察 值 。 
图 6 一 11 甘 语 学 习 者 百分比 高 低 不 同 的 地 区 的 回归 函数 


6.4.2 结论 总 结 


Juv 一 叶 


我 们 所 讨论 的 这 些 结果 可 以 让 我 们 回答 本 节 开 始 所 提出 的 三 个 问题 。 

第 一 ,在 控制 了 经 济 背 景 变 量 之 后 ,该 地 区 美语 学 习 者 百分比 的 高 低 对 学 生 一 教师 比 的 
变化 对 考试 成 绩 的 效应 没有 显著 的 影响 。 在 线性 模型 设 定 中 ,不 存在 显著 的 统计 证 据 表 明 
这 种 差异 存在 。 回 归 (6) 中 的 三 次 设 定 (在 5 名 的 显著 性 水 平 下 ) 提 供 了 对 于 英语 学 习 者 百 
分 比 高 低 不 同 的 地 区 回归 函数 是 不 同 的 这 一 结论 在 统计 上 的 显著 证 据 。 然 而 ,如 图 6 一 11 
所 示 , 在 包含 大 部 分 样本 数据 的 学 生 一 教师 比 的 数值 范围 内 ,所 估计 的 回归 函数 具有 相似 的 
EHE 

第 二 ,在 控制 了 经 济 背 景 变量 之 后 ,存在 学 生 一 教师 比 对 考试 成 绩 的 非 线 人 性 效应 的 证 
据 。 这 个 影响 效应 在 1% 的 水 平 下 在 统计 上 是 显著 的 (S7R* 和 STR 的 系数 在 1% 的 水 平 下 
总 是 显著 的 ) 。 

第 三 ,我们 现在 可 以 回 到 第 4 章 所 提出 的 教育 主管 所 关心 的 问题 。 她 想 知道 降低 学 生 
一 教师 比 2 个 单位 对 考试 成 绩 的 效应 。 在 线性 设 定 (2) 中 ,这 个 效应 不 依赖 于 学 生 一 教师 
比 本 身 ,由 于 这 个 降低 所 得 出 的 千 计 效应 是 使 考试 成 绩 提 高 1.46(( -0.73) x ( -2)) 分 。 
在 非 线 性 设 定 中 ,这 个 效应 依赖 于 学 生 一 教师 比 的 信 。 如 果 目 前 她 所 在 地 区 的 学 生 一 教师 
比 为 20 ,而 她 正 打算 将 其 削减 到 18 ,那么 根据 回归 (5) ,这 一 削减 的 估计 效应 是 使 考试 成 绩 
提高 3. 00 分 ,而 根据 回归 (7) ,这 个 估计 效应 是 2 93。 如 果 目 前 她 所 在 地 区 的 学 生 一 教师 
比 为 22 ,而 她 打算 将 其 前 减 到 20 ,那么 根据 回归 (5) ,这 一 削减 的 估计 效应 是 使 考试 成 绩 提 
高 1.93 分 ,而 移 据 回归 (7) ,这 个 估计 效应 是 1. 90 。 非 线性 设 定 的 估计 效应 表明 ,如 果 学 生 
一 教师 比 已 经 很 小 ,那么 削减 学 生 一 教师 比 的 效应 会 更 大 一 些 。 








r6.5 结论 、 


本 章 提出 了 几 种 建立 非 线性 回归 函数 模型 的 方法 。 由 于 这 些 模型 是 多 元 回归 模型 的 变 
形 , 所 以 末 知 系数 可 以 用 OLS 进行 估计 ,而 关于 它们 的 秆 的 想 设 可 以 用 第 5 章 中 所 描述 的 
统计 量 和 五 统计 量 进 行 答 验 。 在 这 些 模型 中 ,在 保持 其 他 自 变 量 A,A PERET, 
一 个 自 变量 X, 的 变化 对 了 的 期 望 效 应 一 般 依赖 手中 X... X, 的 值 。 

本 章 中 有 很 多 不 同 的 模型 ,而 在 一 个 给 定 的 应 用 中 ,你 不 可 能 会 因 对 该 用 哪 一 个 模型 感 
到 为 难 而 受到 责备 ,那么 在 实际 中 你 该 如 何 分 析 可 能 的 非 线 性 关系 呢 ?”6. 1 节 列 出 了 一 种 
一 般 性 的 分 析 方 法 ,但 是 这 种 方法 要 求 你 要 沿 着 它 一 路 进行 决策 和 判 财 。 如 果 有 一 种 在 每 
个 应 用 中 你 都 能 够 遵循 的 总 是 有 效 的 方法 ,那么 将 会 非常 方便 ,但 是 在 实际 中 数据 分 析 很 少 
会 如 此 简单 。 

在 设 定 非 线 性 回归 函数 中 惟一 最 重要 的 步 又 是 “使 用 你 的 脑子 ”"。 在 观察 数据 之 前 , 根 
据 经 济 理论 或 者 专家 的 判 瞩 ,你 能 想 出 为 什么 总 体 回 妇 函数 的 斜率 可 能 会 依赖 于 这 个 或 那 
个 自 变量 值 的 原因 了 吗 ?》 如 果 你 能 想 出 ,那么 你 预期 会 有 什么 样 的 依赖 性 呢 ? 而 且 最 重要 的 
是 ,什么 样 的 非 线 性 关系 ( 如果 存在 的 话 ) 可 能 会 对 描述 你 所 提出 的 实质 性 问题 有 较 大 的 意 
义 ? 对 这 些 问 题 的 仔细 回答 会 使 你 的 分 析 越 来 越 接近 目标 。 例 如 ,在 考试 成 绩 这 一 案例 的 
应 用 中 ,这 种 推理 会 使 我 们 进一步 研究 , 雇 侦 更 多 的 教师 是 否 会 对 仍 在 学 习 英语 的 学 生 的 百 
分 比较 大 的 地 区 有 更 大 的 影响 ,因为 这 些 学 生 可 能 会 从 更 多 的 个 人 关注 中 得 到 不 同 的 益处 。 
通过 使 问题 变 得 精确 ,我 们 能 够 得 到 一 个 精确 的 答案 ;在 榨 制 了 学 生 的 经 济 背 景 之 后 ,我 们 
发 现 没 有 统计 上 的 显著 证 据 证 明 存 在 这 种 交互 作用 。 








1. 在 非 线 性 回归 中 ,总 体 回归 应 数 的 斜率 依赖 于 一 个 或 多 个 自 变 量 的 值 。 

2. 自 变 量 的 变化 对 了 的 影响 ,可 以 通过 估计 自 变量 在 两 个 值 外 的 回归 函数 来 计算 。 这 
个 方法 在 重要 概念 6.1 中 总 结 。 

3. 一 个 多 项 式 回 归 包 含 了 的 各 次 考 作 为 回归 因子 。 二 次 回 妇 包 会 政和 关 , 而 三 次 回 
18 X,X2 AP, 

4. 对 数 的 一 个 小 的 变化 ,可 被 解释 为 变量 的 比例 变化 或 百分比 变化 。 涉 及 对 数 的 回归 
可 被 用 来 估计 比例 性 变化 和 弹性 。 

5. 两 个 变量 之 积 被 称 为 交叉 项 。 当 交叉 项 作为 回归 因子 被 包含 进来 时 ,它们 允许 一 个 
变量 的 回归 和 斜率 依赖 于 另 一 个 变量 的 值 。 














[重要 术语 ] 


二 次 回归 模型 ” 非 线性 回归 函数 ”多 项 式 回归 模型 ”三 次 回归 模型 ”弹性 ”指数 函数 
自然 对 数 ”线性 对 数 模型 ”对 数 线 性 模型 ” 双 对 数 模型 ”交互 作用 项 ”交互 作用 回归 因 
T ”交互 作用 回归 模型 








化 ,再 计算 一 下 作 房 带 有 景色 时 的 价格 期 望 变化 。 两 者 是 否 存 在 很 大 的 差异 ? 这 个 差异 在 
































统计 上 是 显著 的 吗 ? 
Kí 一 个 特定 地 区 在 过 去 一 年 中 售 出 的 住房 的 数据 
因 变 量 ;In{ Prce} 
bB] f. (1) (2) (3) (4) (5) 
Size 0. 00042 
(0. 000038) 
In( Se) 0.69 0.68 0.57 0.69 
(0.054) (0.087) (2. 03) (0.055) 
]n( Sue)? 0. 0078 
(0.14) 
Bedrooms (0.0036) 
(0.037) 
Pool 0. 082 0.071 0.071 0.071 0.071 
(0.032) (0.034) (0.034) (0.036) (0.035) 
View 0.037 0.027 0.026 0.027 0. 027 
(0.029) (0.028) (0.026) (0.029) (0. 030) 
Pool x mew 0. 0022 
(0.10) 
Conduion 0.13 0.12 0.12 0.12 0. 12 
(0.045) (0.035) (0.035) (0.036) (0.035) 
Intercept 10. 97 6.60 6.63 7.02 6. 60 
(0. 069) (0.39) (0.53) (7.50) (0.40) 
总 括 性 统计 量 
SER 0. 102 0.098 0.099 0. 099 0. 099 





R: 0.72 0.74 0.73 0.73 0.73 


HE EEEN Price = 销售 价格 (美元 ) ;Size = 房屋 大 小 (平方 英尺 ) ; Bedrooms = 卧室 的 数量 ;Pool = 二 
元 变量 ( 若 房 子 有 一 个 游泳 池 为 1, 若 没有 为 0); View = 二 元 变量 (者 房子 有 好 景色 为 1, 若 没有 为 0); 
Condino = 二 元 变 景 (车 房地产 经 纪 南 报告 房 诛 状 况 良 好 为 1 , 若 没 有 为 0) 。 

6.3 在 阅读 完 本 章 考试 成 绩 和 班级 规模 的 分 析 后 ,一 个 教育 工作 者 评论 道 :“ 以 我 的 
经 验 , 学 生 的 成 绩 取 决 于 班级 规模 ,但 不 是 以 你 们 的 回归 所 解释 的 方式 表达 的 。 确 切 地 说 ， 
当班 级 规模 少 于 20 个 学 生 时 ,学 生成 绩 好 ,而 在 班级 规模 超过 25 个 学 生 时 ,学 生成 绩 就 会 
很 糖 糕 。 将 班级 规模 降 到 20 个 学 生 以 下 不 会 有 什么 好 处 ,这 种 关系 在 20 ~25 个 学 生 之 间 
的 中 间 区 域 是 不 变 的 ,而 当 它 已 超过 25 时 ,扩大 班级 规模 没有 什么 损失 。” 这 位 教育 工作 者 
描述 了 一 个 “门槛 效应 " ,其 中 对 于 小 于 20 个 学 生 的 班级 规模 而 言 ,成 绩 是 不 变 的 ;对 于 20 
- 25 个 学 生 之 闻 的 班级 规模 而 言 ,成 绩 发 生 了 跳跃 并 保持 不 变 ; 对 于 超过 25 个 学 生 的 班级 
规模 而 言 ,成 绩 又 发 生 了 一 次 跳 贱 。 为 了 建立 这 些 * 门 槛 效应 ”的 模型 ,定义 二 元 变 基 : 














如 果 STR <20 ,那么 STRsmall = ] ;否则 ,STRsmall = 0 , 

mF 20 = STR =25 ,那么 STRmoderate =1 ;否则 STRmoderate =0, 

如 果 STR >25 ,那么 STRlarge =1; 否 则 ,STRiarge = 0, 

a 考虑 回归 TestScore, = 8, +B, STRsmall, + B,STR1arge, +u 。 请 画 出 回归 系数 假设 值 与 
该 教育 工作 者 的 评论 相 一 致 的 关于 TestScore 和 STR 之 间 关 系 的 回归 函数 图 形 。 

b. 一 名 研究 人 员 试 图 佑 计 出 和 下面 的 回 好 函数 : TestScore, = B, + B, STRsmall, + 
B,STRmoderate, + B,STRlarge, +u, , 却 发 现 她 的 计算 机 死机 了 ,为 什么 ? 

“6.4 请 解释 你 将 如 何 用 5.8 节 中 的 “方法 2” 计算 方程 (6.8) 下 面 所 讨论 的 置信 区 
间 。( 提 示 : 这 需要 用 回归 因子 和 因 变 其 的 不 同 定 义 来 估计 一 个 新 的 回归 , 见 练习 (5. 8)) 

6.5 考虑 回归 模型 :Y= 8, + BX +B,X, +B, (X, x X,) + ws。 使 用 重要 概念 6.1， 
证 明 ， 


a. 总 =B, +6,X, (HERE X, 不 变 的 情况 下 , 变化 的 效应 ) 
. 总 =B: +B,X,( 在 保持 不 变 的 情况 下 ,XX 变化 的 效应 ) 


ce. WME X, 变化 AT ü X, 变化 AX, ,那么 : 
AY = (A, +B,X,) AX, + (B, +B,X,) AX, +B,AX AX, 


s/a 


”基于 多 元 回归 的 
评估 研究 








前 面 的 三 章 解 释 了 如 何 用 多 元 回归 来 分 析 数 据 集中 变量 之 间 的 关系 。 在 本 章 , 我 们 回 
过 头 来 问 一 下 ,是 什么 因素 决定 多 元 回归 研究 是 可 靠 的 还 是 不 可 靠 的 ? 我 们 将 集中 在 以 估 
计 某 个 自 变 醒 ( 如 班级 规模 ) 的 变化 对 因 变 量 ( 如 考试 成 绩 ) 的 因果 效 应 分 析 为 目的 的 统计 
研究 上 。 对 于 这 样 的 研究 ,多 元 回归 在 什么 时 候 能 提供 一 个 关于 因果 兹 应 的 有 用 估计 ? Fl 
样 重要 的 是 ,在 什么 时 候 它 不 能 敌 到 这 一 点 ? 

为 了 回答 这 个 问题 ,本 章 提 出 了 评估 统 计 研 究 的 一 个 一 般 性 框架 ,不 管 它们 是 否 使 用 了 
回归 分 析 。 这 个 框架 依赖 于 内 部 和 外 部 有 效 性 的 概念 。 如 果 一 个 研究 中 关于 因果 效应 的 统 
计 推 断 ,对 所 研究 的 总 体 和 环境 设 定 是 有 效 的 , 那 公 它 就 是 内 部 有 效 的 ;如果 它 的 推断 能 够 
被 推广 到 其 他 的 总 体 和 环境 设 定 中 ,那么 它 就 是 外 部 有 效 的 。 在 7.1 节 和 7.2 节 , 我 们 讨论 
了 内 部 有 效 性 和 外 部 有 效 性 , 列 出 了 各 种 可 能 的 对 内 部 有 效 性 和 外 部 有 获 性 产生 万 腑 的 因 
素 , 并 讨论 了 在 实际 中 如 何 识别 这 些 威胁 。 有 些 威胁 还 不 能 用 先 今 为 止 所 介绍 的 经 济 计量 
学 工具 来 处 理 , 本 章 为 本 书 余 下 章节 中 所 研究 的 处 理 这 些 契 及 的 方法 提供 了 一 个 预览 。 

作为 曾 述 内 部 和 外 部 有 效 性 框架 的 一 个 例子 ,在 7.3 节 我 们 对 第 4 章 ~ 第 6 章 中 所 提 
出 的 前 减 学 生 一 教师 比 对 考试 成 绩 影 响 这 项 研究 的 内 部 有 效 性 和 外部 有 效 性 进行 了 评估 。 


[7.1_ 内 部 有 效 性 和 外 部 有 效 性 . 


在 重要 概念 7. 1 中 定义 的 内 部 有 效 性 和 外 部 有 效 性 的 概念 ,提供 了 一 个 用 来 评估 一 项 
统计 研究 或 经 济 计量 研究 对 回答 某 一 感 兴 趣 的 具体 问题 是 否 有 用 的 框架 。 

内 部 有 效 性 和 外 部 有 效 性 ,将 所 研究 的 总 体 与 环境 设 定 同 结果 被 推广 到 的 总 体 和 环境 
BERANE, HANA At {population studied) ,是 指 我 们 所 研究 的 样本 一 一 个 人 、 公 
司 .学 区 等 等 一 都 是 从 其 中 抽取 出 来 的 实体 性 总 体 。 所 谓 结果 被 推广 到 的 总 体 或 感 兴趣 
的 总 体 {population of interest) ,是 指 所 研究 的 因果 关系 推断 被 应 用 于 其 中 的 实体 性 总 体 。 

















例如 ,一 位 高 中 (9 ~ 12 年 级 ) 校 长 可 能 想 要 将 我 们 关于 加 利 福 尼 亚 州 小 学 学 区 (研究 的 总 
IK) 的 班级 规模 和 考试 成 绩 的 研究 结论 推广 到 高 中 的 总 体 ( 感 兴趣 的 总 体 ) 中 。 

对 于 “环境 设 定 ” ,我 们 意 指 制度 的 .法律 的 ,社会 的 和 经 济 的 环境 。 例 如 ,在 实验 室 中 
进行 的 评估 种 植 有 机 西红柿 的 方法 ,是 否 可 以 被 推广 到 田地 里 , 即 在 实验 室 的 环境 设 定 下 起 
作用 的 有 机 方法 在 现实 世界 的 环境 设 定 下 是 否 仍 起 作用 ,知道 这 一 结论 是 非常 重要 的 。 在 
小 节 后 向 的 部 分 ,我 们 提供 了 总 体 和 环境 设 定 差异 的 其 他 例子 。 


7.1.1 对 内 部 有 效 性 的 威胁 


内 部 有 效 性 有 两 个 组 成 部 分 。 首 先 ,因果 效应 的 生计 量 应 该 是 无 偏 的 且 一 致 的 。 例 如 ， 
如 果 启 mm 是 某 个 回归 中 学 生 一 教师 比 的 单位 变化 对 考试 成 绩 影 响 的 OLS 佑 计量 ,那么 Bs， 
就 应 该 是 学 生 一 教师 比 发 生变 化 对 真实 总 体 因果 效应 即 Bsrx 的 一 个 无 偏 的 且 一 致 的 估计 
其 。 其 次 ,假设 检验 应 该 具有 希望 达到 的 显著 性 水 平 (在 零 假设 下 检验 的 实际 拒绝 率 应 该 
等 于 它 希 刻 达到 的 局 著 性 水 平 ) ,而 且 置 信 区 间 应 该 具有 希望 达到 的 置信 水 平 。 例 如 ,如 果 
一 个 置信 区 间 被 构造 为 Bom t1. 968E (Boma) ,那么 这 个 置信 区 间 应 该 在 重复 抽取 的 样本 中 
以 5 名 的 概率 包含 真实 的 总 体 因 果 效 应 Brw。 


重要 概念 7. 1 


内 部 有 效 性 和 外 部 有 效 性 

如 果 一 项 关于 因果 效应 的 统计 推断 对 所 研究 的 总 体 来 说 是 有 效 的 ,那么 该 统计 分 析 就 
是 内 部 有 效 的 (internally valid) 。 如 果 其 推断 和 结论 能 够 从 所 研究 的 总 体 和 环境 设 定 中 , 推 
广 到 其 他 的 总 体 和 环境 设 定 中 ,那么 这 个 分 析 就 是 外 部 有 效 的 [externally valid) 。 

在 回归 分 析 中 ,因果 效应 使 用 所 估计 的 回归 消 数 进行 估计 ,而 假设 检验 则 使 用 所 估计 的 
回归 系数 及 其 标准 误 来 进行 。 因 此 ,在 以 0LS 回归 为 基础 的 一 项 研究 中 ,对 内 部 有 效 性 的 
ERRER OLS 估计 量 是 无 偏 的 昌 一 致 的 ,而 且 标 准 误 是 在 满足 置信 区 间 具 有 和 希望 达到 的 
置信 水 平 的 条 件 下 进行 计算 的 。 许 多 原因 使 得 这 一 点 可 能 不 会 发 生 , 而 这 些 原因 就 构成 了 
对 内 部 有 效 性 的 威胁 。 这 些 威胁 导致 了 重要 概念 5.4 中 一 个 或 多 个 最 小 二 乘 假设 的 失效 。 
例如 ,我 们 已 详细 讨论 过 的 一 个 威 肪 是 遗漏 变量 偏差 ,这 导致 了 一 个 或 多 个 回归 因子 和 误差 
项 相关 ,从 而 违背 了 第 一 条 最 小 二 乘 假设 条 件 。 如 果 可 以 获得 该 遗漏 变量 的 数据 ,那么 和 过 
将 这 个 变量 作为 额外 的 回归 因子 绰 人 到 回归 方程 中 ,这 个 威胁 就 可 以 避免 。 

7. 2 节 详 细 讨 论 了 多 元 回归 分 析 中 内 部 有 效 性 的 不 同 威胁 ,以 及 如 何 缓解 它们 的 影响 。 


7. 1.2 对 外 部 有 效 性 的 威胁 


外 部 有 效 性 的 潜在 威胁 是 由 所 研究 的 总 体 和 环境 设 定 与 感 兴趣 的 总 体 和 环境 设 定之 问 
的 差异 所 引起 的 。 . 

总 体 间 的 差异 。 所 研究 的 总 体 和 感 兴趣 的 总 体 之 间 的 差异 可 能 对 外 部 有 效 性 构成 威 
胁 。 例 如 ,化 学 药品 毒性 效应 的 实验 室 研究 典型 地 使 用 像 老鼠 这 样 的 动物 总 体 { 所 研究 的 
总 体 ) ,但 是 研究 结果 却 被 用 来 书写 人 类 总 体 ( 感 兴趣 的 总 体 ) 的 健康 和 安全 规则 。 老 鼠 和 
人 类 之 间 是 否 存 在 相当 大 的 不 同 , 以 至 于 影响 到 该 项 研究 的 外 部 有 效 性 ,这 是 个 有 争论 的 
问题 。 

更 一 般 地 说 ,真实 的 因果 效应 在 所 研究 的 总 体 和 感 兴趣 徇 总 体 中 可 能 是 不 一 样 的 ,这 可 


能 是 因为 总 体 被 选择 的 方式 在 研究 总 体 和 感 兴趣 总 体 之 问 是 不 同 的 ,可 能 是 因为 总 体 的 特 
征 不 同 ,可 能 是 因为 地 理 的 差异 ,也 可 能 是 因为 研究 已 经 过 时 了 。 

环境 设 定 间 的 差异 。 即 使 所 研究 的 总 体 和 感 兴趣 的 总 体 是 完全 相同 的 ,但 如 果 环 境 设 
定 {settings) 不 同 ,也 不 应 该 去 推广 研究 结果 。 例 如 ,如 果 两 所 大 学 规定 的 法 定 饮酒 年 龄 不 
局 的 话 ,那么 禁酒 广告 运动 对 大 学 狂欢 饮酒 影响 的 研究 可 能 无 法 推广 到 另 一 个 相同 的 大 学 
学 生 团 体 中 。 在 这 种 情形 下 ,实施 研究 的 总 体 的 法 律 环境 设 定 不 同 于 其 结果 应 用 的 总 体 的 
法 律 环境 设 定 。 

更 一 般 地 说 ,环境 设 定 不 同 的 例子 包括 机 构 环境 盖 异 ( 公立 大 学 与 宗教 大 学 ) ,法 律 差 
蜡 ( 法 定 饮酒 年 龄 上 的 差异 ) 或 自然 环境 差异 { 南 加 利 福 尼 亚 州 与 费 尔 班 克 斯 州 .阿拉 斯 加 
州 的 狂欢 饮酒 会 ) 。 

在 考试 成 绩 和 学 生 一 教师 比 案 何 中 的 应 用 。 第 5 章 和 第 6 章 报告 了 削减 学 生 一 教师 比 
可 以 改进 学 生 考试 成 绩 这 个 结果 ,这 个 结果 在 统计 上 是 显著 的 ,但 实质 上 量 却 是 很 小 的 。 这 
个 分 析 是 报 据 加 利 福 尼 亚 州 学 区 的 数据 敌 出 的 。 假 设 这 些 结 果 在 目前 是 内 部 有 效 的 ,那么 ， 
这 个 结果 可 能 被 推广 到 哪些 感 兴趣 的 其 他 总 体 和 环境 设 定 中 呢 ? 

所 研究 的 总 体 和 环境 设 定 与 感 兴趣 的 总 体 和 环境 设 定 越 接近 ,外 部 有 效 性 就 越 强 。 例 
如 ,大学生 和 大 学 教育 非常 不 同 于 小 学 生 和 初等 教育 ,所 以 要 把 从 加 利 福 尼 亚 州 小 学 学 区 数 
据 中 所 估计 的 削减 班级 规模 的 影响 推广 到 大 学 中 ,位 乎 是 不 合理 的 。 另 一 方面 ,全 美国 的 小 
学 学 生 、 课 程 和 小 学 中 的 组 级 广 泛 地 相 拟 , 因 此 ,加 利 福 尼 亚 州 的 研究 结果 可 以 被 推广 到 美 
国 其 他 小 学 学 区 的 标准 化 考试 成 绩 分 析 中 ,这 做 乎 是 合理 的 。 

如 何 评价 - -项 研究 的 外 部 有 效 性 ”外 部 有 效 性 必须 使 用 关于 所 研究 的 总 体 和 环境 设 定 
与 感 兴趣 的 总 体 和 环境 设 定 的 具体 知识 进行 判断 。 这 两 者 之 间 的 重要 差异 将 会 对 该 项 研究 
的 外 部 有 效 性 提出 质疑 。 

有 时 存在 两 个 或 多 个 关于 不 同 的 但 却 是 相关 的 总 体 的 研究 。 如 果 是 这 样 的 话 ,那么 两 
项 研究 的 外 部 有 效 性 可 以 通过 比较 它们 的 结果 进行 检验 。 例 如 ,在 7.3 节 我 们 分 析 了 马 萨 
诸 塞 州 小 学 学 区 的 考试 成 绩 和 班级 规模 数据 ,并 比较 了 马萨诸塞 州 和 加 利 福 尼 亚 州 的 结果 。 
一 般 地 说 ,两 个 或 多 个 研究 中 的 相似 结论 支持 了 外 部 有 效 性 的 断言 ,而 它们 的 结论 中 不 易 解 
释 的 差异 对 它们 的 外 部 有 效 性 提出 了 质疑 ,名 

如 何 设 计 一 项 具有 外 部 有 效 性 的 研究 ?由 于 外 部 有 效 性 的 威胁 来 自 于 总 体 和 环境 设 定 
缺乏 可 比 性 ,因此 最 好 在 研究 的 早期 阶段 ,在 搜集 数据 之 前 将 这 些 威 胁 最 小 化 。 研 究 设 计 超 
出 了 本 书 的 范围 ,有 兴趣 的 读者 可 以 参考 Shadish , Cook 与 Campbell(2002) 的 书 。 





[7.2 对 多 元 回归 分 析 内 部 有 效 性 的 威胁 ] 


如 果 所 估计 的 区 归 系 数 是 无 篇 的 且 一 致 的 ,并 且 它 们 的 标准 误会 生成 与 希望 达到 的 置 
信 水 平一 致 的 置信 区 间 , 那 么 基于 回归 分 析 的 研究 就 是 内 部 有 效 的 。 本 节 将 研究 为 什么 多 
元 回归 系数 的 OLS 佑 计量 可 能 是 有 偏 的 五 个 原因 (即使 在 大 样本 条 件 下 ) :遗漏 变量 ,回归 
函数 函数 形式 的 误 定 , 自 变量 的 不 精确 测度 (“ 变 量 误差 ) ,样本 选择 , 联 立 因果 关系 。 之 所 





名 “对 同一 个 主题 进行 的 许多 相关 研究 的 比较 RI ati 例如 ,第 5 章 的 一 般 兴趣 框 中 关于 * 真 扎 特效 
以 天 项 研究 进行 元 分 析 有 其 自身 的 挑战 。 居 如 何 从 差 的 研究 中 挠 选 出 好 的 研究 ? 
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以 会 出 现 所 有 这 五 个 偏差 来 源 , 是 因为 总 体 回归 中 的 回归 因子 和 误差 项 相关 ,违背 了 重要 概 
念 5.4 中 的 第 一 个 最 小 二 乘 假 设 条 件 。 我 们 讨论 了 如 何 处 理 每 一 个 偏差 的 来 源 并 如 何 减 少 
这 些 来 源 所 造成 的 偏差 。 本 节 最 后 讨论 了 导致 不 一 致 标准 误 的 情况 以 及 如 何 处 理 这 些 问 题 
的 方法 。 


7.2.1 遗漏 变量 偏差 


回想 一 下 , 当 一 个 骂 决 定 了 又 和 方程 中 的 一 个 或 多 个 回 晤 内 于 相关 的 变量 从 回归 中 遵 
漏 掉 时 ,就 会 产生 遗漏 变量 偏差 。 这 个 偏差 即使 在 大 样本 中 也 存在 ,因此 在 这 种 情况 下 OLS 
估计 鞭 是 不 一 致 的 。 如 何 能 更 好 地 使 遗 潮 变 量 偏 差 最 小 化 ,取决 于 是 否 可 获得 潜在 的 遗 泌 
变量 的 数据 。 

当 遗 漏 变 基 可 被 观测 时 ,解决 遗漏 变 基 偏 益 的 办 法 。 如 果 你 有 关于 遗漏 变量 的 数据 , 那 
么 你 就 可 以 把 这 个 变量 引信 到 多 元 血 归 中 ,这 样 问题 就 解决 了 。 然 而 ,增加 新 的 变量 有 收益 
也 有 损失 。 一 方面 ,遗漏 了 变量 可 能 会 导致 遗漏 变量 偏差 。 另 一 方面 , 当 它 不 属于 回归 时 
《也 就 是 说 , 当 它 的 总 体 回 归 系 数 为 零 时 ) , 引 人 这 个 变量 会 妖 低 其 他 回归 系数 佑 计量 的 精 
度 。 换 名 话说 ,决定 是 否 引 入 一 个 变量 ,涉及 在 发 生 偏 差 和 增加 系数 方差 之 间 进 行 权衡 。 在 
实 戚 中 ,有 四 个 步骤 可 以 帮助 你 决定 是 否 在 回 好 中 引信 人 一 个 变量 或 一 组 变量 。 

第 一 步 ,识别 回归 中 那个 系数 是 关键 系数 。 在 考试 成 绩 的 回归 中 ,关键 系数 就 是 学 生 一 
教师 比 的 系数 ,因为 最 初 提出 的 问题 与 碱 少 学 生 一 教师 比 对 考试 成 绩 的 影响 有 头 。 

第 二 步 , 间 问 你 自己 :在 这 个 回归 中 ,重要 的 赐 漏 变量 偏差 的 最 有 可 能 的 来 源 是 什么 ? 
回答 这 个 问题 要 求 应 用 经 济 理论 和 专家 知识 ,而 且 在 你 实际 进行 任何 回归 以 前 就 应 该 想到 。 
因为 这 在 分 析 数 据 之 前 就 应 该 做 了 ,所 以 又 被 称 为 先 验 (“事前 的 ” ) 推 理 。 在 考试 成 绩 的 例 
子 中 ,这 一 步 需 要 我 们 识别 那些 决定 考试 成 绩 的 因素 ,如 果 被 忽略 了 ,就 可 能 会 使 班级 规模 
效应 的 估计 量 产生 偏差 。 这 一 步 的 结果 引出 了 基准 的 回归 设 定 ,也 是 经 验 回归 分 析 的 起 点 ， 
可 能 会 有 助 于 缓和 址 漏 变量 偏差 的 一 系列 额外 的 "可疑 "变量 。 

第 三 步 ,用 第 二 步 中 识别 出 来 的 额外 可 疑 变量 来 扩展 你 的 基准 设 定 ,并 检验 它们 的 系数 
均 为 零 的 假设 。 如 果 额 外 变量 的 系数 在 统计 上 是 显著 的 ,或 者 如 果 当 额外 变量 被 包含 进来 
时 , 感 兴趣 的 估计 系数 发 生 了 明显 变化 ,那么 它们 应 该 保留 在 设 定 中 ,你 应 该 修正 基准 设 定 。 
如 果 不 是 的 话 , 这 些 变量 就 可 以 排除 在 回归 以 外 。 

第 四 步 ,以 表格 的 形式 把 你 的 分 析 结 果 准 确 地 概括 出 来 。 这 向 潜在 的 抱 怀疑 态度 的 人 
提供 了 一 种 "完全 的 拔 吉 ” ,于 是 他 (或 她 } 可 以 据 此 得 出 自己 的 结论 。 表 5 一 2 和 表 6 一 3 就 
是 这 个 方法 的 例子 。 例 如 ,在 表 6 一 3 中 ,我 们 本 可 以 只 介绍 第 (7) 列 中 的 回归 , 荐 为 该 回归 
概括 了 该 表 中 其 他 回归 的 相关 效应 和 非 线性 问题 , 疝 是 ,给 出 其 他 的 回归 结果 ,就 可 以 允许 
那些 持 怀疑 意见 的 读者 得 出 自己 的 结论 。 

这 些 步骤 在 重要 概念 7. 2 中 总 结 。 

当 遗 奖 变 姐 观 测 不 到 时 ,解决 遗漏 变革 偏差 的 方法 。 邵 果 你 没有 关于 遗漏 变量 的 数据 ， 
那么 将 该 遗漏 变 量 添 加 到 回归 中 就 不 是 一 种 很 好 的 选择 ,不 过 仍然 有 其 他 三 种 解决 遗 泼 变 
其 偏差 的 方法 。 这 三 种 解决 方法 中 的 每 个 方法 ,通过 使 用 不 同类 型 的 数据 ,都 可 以 防止 遗漏 
变量 偏差 的 发 生 。 

第 一 种 解决 方法 是 ,使 用 相同 的 观测 单位 在 不 同时 点 上 被 适时 观测 到 的 数据 。 例 如 ,对 
同一 个 地 区 而 言 ,可 以 搜集 1995 年 的 考试 成 绩 和 相关 的 数据 ,同时 在 2000 年 再 搜集 一 次 ， 
这 种 形式 的 数据 叫做 面板 数据 。 如 第 8 章 所 解释 的 ,只 要 那些 遗漏 变量 不 随时 间 变 化 而 变 


化 ,面板 数据 就 会 使 控制 那些 无 法 观测 到 的 遗漏 变量 成 为 可 能 。 

第 二 种 解决 方法 是 ,使 用 工具 变量 回归 。 这 种 方法 依赖 于 一 个 新 的 变量 ,这 个 变量 被 称 
为 工具 变量 。 工具 变量 回归 在 第 10 章 中 进行 讨论 。 

第 三 种 解决 方法 是 ,使 用 一 项 研究 设计 ,在 这 项 研究 设计 中 ,使 用 随机 化 的 控制 实验 来 
研究 我 们 所 关心 的 效应 ( 比如 ,减少 班级 规模 对 学 生成 绩 的 影响 ) 。 随 机 化 榨 制 实验 在 第 H 
章 中 讨论 。 


7.2.2 回归 消 数 中 函数 形式 的 误 设 定 


如 果 直 实 的 总 体 回 归 渗 数 基 非 线性 的 ,但 所 估计 的 回归 却 是 线性 的 ,那么 这 个 函数 形式 
误 定 [funetional form misspecification ) 就 会 使 OLS 估计 量变 成 是 有 偏 的 。 这 种 偏差 是 遗漏 
变量 偏差 的 一 种 类 光 ,其 中 的 遗漏 变量 是 反映 回归 范 数 中 缺失 的 非 线性 特征 的 项 。 例 如 ,如 
朵 总 体 回 归 范 数 是 个 二 次 多 项 式 ,那么 如 果 遗 漏 了 自 变 其 平方 项 ,相应 的 回归 就 将 产生 遗漏 
变量 偏差 。 

晴 数 形式 误 定 的 解决 方法 。 当 自 变 量 ( 如 考试 成 绩 ) 为 连续 的 时 ,那么 可 以 用 第 6 章 的 
方法 解决 这 个 潜在 的 非 线 性 问题 。 不 过 ,如 果 自 变 基 是 离散 的 或 二 元 的 (例如 ,如 果 第 i 个 
人 上 了 大 学 ,那么 了 等 于 1; 知 则 等 于 0) ,那么 问题 就 更 复杂 了 。 第 9 章 讨论 了 离散 型 因 恋 
其 的 回归 。 


重要 概念 7.2 


我 应 该 在 回归 中 包含 更 多 的 变量 吗 

如 果 你 在 多 元 回归 中 包含 了 另 一 个 变量 ,那么 你 会 消除 因 排 除 那个 变量 所 引起 的 遗漏 
变量 偏差 的 可 能 性 ,但 是 你 所 关心 的 系数 估计 量 的 方差 可 能 会 增加 。 这 里 给 出 一 些 帮助 你 
决定 是 否 包 含 额外 变量 的 准则 ， 

1. 明确 确定 系数 或 你 所 感 兴趣 的 系数 。 

2. 使 用 先 验 推理 ,识别 遗漏 变量 偏差 的 最 重要 的 潜在 来 源 , 导 出 基准 设 定 和 一 些 “ 可 
EEE. 

3. 检验 额外 的 可 疑 变 量 的 系数 是 否 为 零 。 

4. 用 “完全 披 锋 "的 有 代表 性 的 列表 方法 给 出 你 的 分 析 结 果 , 以 便 其 他 人 能 够 看 到 引入 
可 疑 变量 对 所 关心 的 系数 的 效应 。 如 果 你 引信 人 了 一 个 可 疑 变量 ,你 的 结果 发 生变 化 了 吗 ? 


7.2.3 变量 误差 

假设 在 考试 成 绩 对 学 生 一 教师 比 的 回归 中 ,我 们 不 经 意 地 将 数据 混合 在 一 起 了 ,使 我 们 
以 五 年 级 的 考试 成 绩 对 该 地 区 十 年 级 的 学 生 一 教师 比 进 行 了 回归 。 尽 管 五 年 级 的 学 生 一 教 
师 比 和 十 年 级 的 学 生 一 教师 比 可 能 是 相关 的 ,但 它们 是 不 一 样 的 ,因此 这 种 混合 会 导致 估计 
系数 的 偏差 ,这 就 是 变量 误差 偏差 {errors-in-variables bias) 的 一 个 例子 ,因为 它 的 来 源 是 
自 变量 测 度 误差 。 这 个 偏差 即使 在 很 大 的 样本 中 依然 存在 ,因此 如 果 存 在 测度 误差 的 话 , 那 
Z, OLS 佑 计量 就 是 不 一 致 的 。 

调度 误差 有 许多 可 能 的 来 源 。 如 果 数 据 是 通过 调查 搜集 的 ,那么 应 答 者 可 能 会 给 出 错 
误 的 回答。 例如 ,在 当前 人 口 调查 中 有 一 个 问题 涉及 去 年 的 收 人 。 应 答 者 可 能 不 知道 他 的 
确切 收 人 ,或 者 可 能 由 于 某 些 其 他 的 原因 说 错 了 。 如 果 数 据 是 从 计算 机 化 的 管理 记录 中 获 
得 的 ,那么 当 数据 被 初次 输入 时 ,可 能 也 会 有 打字 输 人 错误 。 














为 了 理解 变量 误差 偏差 导致 回归 因子 和 误差 项 之 间 的 相关 ,假设 有 一 个 轩 归 因子 义 
(如 实际 收入 ) ,但 是 是 由 名 ( 应 答 者 的 收入 的 估计 值 ) 不 精确 地 测度 出 的 。 因 为 观测 到 
的 是 充 而 非 总 ,所 以 实际 上 所 估计 出 来 的 回归 方程 是 基于 立 的 回归 。 用 这 个 不 精确 测度 
到 的 变量 站 , 写 出 总 体 回 归 方程 了 = 所 +B X +u: 
Y, =& +B +iB (X - X) +u] 


=, +B. +, (7.1) 
其 中 , =A (X. - XY) +u Aie, A Z, 的 形式 表示 的 痊 体 回归 方程 有 个 包含 工 和 宇 235 BJ 


误差 项 。 如 果 这 个 差 与 测度 值 Y 相关 ,那么 回归 因子 这 将 会 与 误差 项 相关 ,名 将 会 是 有 偏 
的 且 不 一 致 的 。 


ñ, 偏差 确切 的 大 小 和 方向 依赖 于 下 和 (X, -学 ) 之 闻 的 相关 性 ,而 这 个 相关 性 反 过 来 又 
依赖 于 测度 误差 的 具体 性 质 。 

举 一 个 例子 ,假设 调查 应 答 省 给 出 了 自 变 量 ,的 实际 值 的 最 好 攻 测 或 回忆 ,数学 上 描 
述 这 一 点 的 简便 方法 是 假设 的 测度 值 等 于 实际 的 非 测 度 值 加 上 一个 完全 随机 成 分 w,, 因 


此 ,该 变 量 的 测度 值 ( 记 为 总 ) AŠ = X +w,。 由 于 误差 项 是 完全 随机 的 ,因此 我 们 可 以 假 
定 w, 具有 零 均值 和 方差 o) ,并且 o, 同 针 和 回归 误差 项 2, 不 相关 。 在 这 个 假设 下 ,应 用 一 
点 儿 代数 知识 D 就 可 以 证 明 记 具有 概率 极限 ; 


z 
ñ. 一 (7.2) 


也 就 是 说 ， 如 果 这 种 测度 不 精确 性 具有 只 对 和 变量 的 实际 值 增加 一 个 随机 成 分 的 作用 ， 
那么 房 就 是 不 一 致 的 。 因为 比 于 2 小 于 1 ,所 以 房 将 会 向 0 方向 发 生 偏差 ,即使 在 大 
样本 中 亦 如 此 。 在 这 种 极端 情形 下 , 即 测度 误差 很 大 ,以 至 于 基本 上 没有 留 下 关于 郊 的 任 
何 信息 ,在 表达 式 (7.2) 最 后 表达 式 中 的 方差 比率 为 零 , 启 依 概率 收 合 于 零 。 在 另 一 个 极端 


情形 下 , 当 不 存在 测度 误差 时 ,oz =0, 所 以 记 一 一 6,。 

尽管 表达 式 (7.2) 中 的 结果 对 这 个 特殊 类 型 的 测度 误差 来 说 是 具体 的 ,但 它 前 明了 更 
一 般 的 命题 一 一 如 果 自 变量 没有 被 精确 地 测度 ,那么 即使 在 大 样本 中 OLS 估计 量 也 是 有 仿 
的 。 变 量 误差 偏差 在 重要 概念 7. 3 中 总 结 。 

变量 误差 偏差 的 解决 方法 。 解 决 变量 误差 问题 的 最 好 方法 是 得 到 导 的 精确 测度 值 。 如 
果 这 是 不 可 能 的 ,那么 还 有 一 些 经 济 计量 方法 可 用 来 缓和 变量 误差 的 偏差 。 

第 一 种 方法 是 工具 变量 回归 。 这 依赖 于 另 一 个 与 实际 值 蕊 相关 ,但 与 测量 误差 不 相关 
的 变量 (“工具 ”变量 ) 。 这 种 方法 在 第 10 章 中 研究 。 

第 二 种 方法 是 导出 测度 误差 的 数学 异型 ,而 且 如 果 可 能 的 话 , 用 相应 导出 的 公式 来 调整 





D 在 这 个 测度 误 莽 假设 下 ,=PBi (4, -) tu = -Aw +u, cov(Ë..u,) =0, H eo, w) =eov(Y,+aw,,w,) = 
a PVR cori, +o) = -peor A, +m) +eov( È, +u) = -BLot。 因 此 ,由 表达 式 {5.1) 得 , 启 —8, -etrr MA 


sy =o, +a? PA B, may -por rh + l) =[o=y/(Gy+r1)]6,o 


佑 计 值 。 例 如 ,如 果 一 位 研究 人 员 相信 ,所 测度 的 变量 实际 上 是 实际 值 和 随机 测度 误差 项 之 
和 , 鹿 旦 如 果 她 知道 或 能 够 估计 出 比率 =. oy ,那么 她 就 能 够 用 表达 式 (7. 2) 计 算 一 个 修正 
了 向 下 偏差 的 B 的 估计 量 。 由 于 这 种 方法 要 求知 道 关 于 测度 误差 性 质 的 专业 知识 ,对 于 给 
定 的 一 个 数据 集 及 其 测度 问题 ,细节 通常 是 很 具体 的 ,因此 我 们 在 本 书 中 将 不 再 继续 研究 这 
种 方法 。 


重要 概念 7.3 


变量 误差 偏 状 
当 一 个 自 变 量 被 不 精确 地 测度 时 ,就 会 产生 OLS 估计 量 的 变量 误差 的 偏差 。 这 个 偏差 
依赖 于 测度 误差 的 性 质 ,并 且 即 使 在 样本 容量 很 大 的 情况 下 依然 存在 。 如 果 所 测度 的 变量 
等 于 实际 值 加 上 一 个 零 均 值 的 ,独立 分 布 的 测度 误差 项 ,那么 在 只 具有 一 个 右边 变量 的 回归 
中 ,OLS 估计 量 偏 向 于 零 , 表 达 式 (7,2) 给 出 了 它 的 概率 极限 。 


7.2.4 样本 选择 


当 数 据 的 可 获得 性 受到 选择 过 程 的 影响 ,而 且 这 个 选择 过 程 与 自 变 量 的 值 相 关 时 ,就 会 
发 生 样本 选择 偏差 1 sample selection bias} 。 这 个 选择 过 程 会 引致 误差 项 和 回归 因 于 之 间 
的 相关 性 ,从 而 会 导致 0LS 估计 量 的 偏差 。 

与 因 变 量 的 值 不 相关 的 样本 选择 不 会 产生 偏差 。 例 如 ,如 果 数 据 是 通过 简单 随机 抽样 
从 总 体 中 搜集 的 ,那么 抽样 方法 ( 从 总 体 中 随机 地 抽取 ) 与 自 变量 的 值 没有 关系 。 这 样 的 抽 
样 不 会 引 人 偏 差 。 

当 抽样 方法 与 因 变 量 的 值 相关 时 ,就 可 能 会 引 人 偏 差 。 在 第 3 章 的 方 框 中 给 出 了 一 个 
关于 民意 测验 中 样本 选择 偏差 的 例子 。 在 那个 例 于 中 ,样本 选择 方法 (随机 选择 汽车 车 主 
的 电话 号 码 ) 与 因 变量 (个 人 支持 谁 在 1936 年 当 总 统 ) 相关, 内 为 在 1936 年 拥有 电话 的 汽 
车 车 主 比较 可 能 是 共和 党 人 。 

在 经 济 学 中 ,样本 选择 今 差 的 一 个 例 于 ,经 常 是 用 工资 对 教育 的 回归 中 售 计 每 增加 一 年 
的 教育 对 工资 的 影响 作为 说 明 。 根 据 定义 ,只 有 那些 有 工作 的 人 才 有 工资 。 决 定 一 个 人 是 
否 有 工作 的 因素 (可 观测 的 和 不 可 观测 的 ) 一 一 教育 ,经 验 、 居 住地、 能力 .运气 等 一 一 与 决 
定 该 人 在 有 工作 时 赚 多 少 钱 的 因素 相似 。 因 此 , 某 人 有 工作 的 事实 表明 ,如 果 其 他 所 有 的 条 
件 都 相同 ,那么 他 前 工资 方程 中 的 误差 项 是 正 的 。 换 句 话说 , 某 人 是 否 有 工作 部 分 地 由 工资 
回归 方程 误差 项 中 的 遗 浇 变 量 决定 。 因 此 , 某 人 有 工作 ,而 且 显示 在 数据 集中 这 一 简单 事 
实 , 军 少 平均 来 看 ,提供 了 误差 项 为 正 的 ,而 有 自 可 能 与 回归 因子 相关 的 信息 。 这 也 会 使 0LS 
个 计量 产生 偏差 。 

样本 选择 偏差 在 重要 概念 7.4 中 总 结 。 

选择 偏差 的 解决 方法 。 到 目前 为 止 ,我 们 所 讨论 的 方法 还 不 能 消除 样本 选择 偏差 。 估 
计 带 有 样本 选择 的 模型 的 方法 超出 了 本 书 的 范围 ,这 些 方法 建立 在 第 9 章 所 介绍 的 技术 之 
上 , 那 一 部 分 提供 了 进一步 的 参考 。 


7.2.5 联 立 因果 关系 


迄今 为 止 ,我 们 是 假设 因果 关系 从 回归 因子 传导 到 因 变 基 ( 基 世 引致 Y) ,但 是 如 果 因 
果 关 系 也 是 从 因 变 量 传 导 到 一 个 或 多 个 回归 因子 ( 即 了 引致 了 ) ,那么 情况 会 怎样 呢 ? 如 果 
是 这 样 的 话 , 因 果 关 系 除 了 * 向 后 "传导 外 ,还 “向 前 "传导 ,也 就 是 说 ,存在 联 立 因果 关系 

















(simultaneous causality) 。 如 果 存 在 联 立 因果 关系 ,那么 OLS 回归 得 到 两 个 效应 ,因此 
OLS 估计 若是 有 偏 的 且 不 一 致 的 。 


重要 概念 7.4 


样本 选择 偏差 

当选 择 过 程 影响 到 数据 的 可 获得 性 且 该 过 程 与 因 变量 相关 时 ,就 会 产生 样本 选择 偏差 。 
样本 选择 引致 一 个 或 多 个 回归 因子 与 误差 项 相关 , 从 而 导致 OLS 估计 量 的 偏差 且 不 一 
致 性 。 

例如 ,我 们 对 考试 成 绩 的 研究 集中 于 分 析 减 少 学 生 一 教师 比 对 考试 成 绩 的 影响 ,所 以 因 
果 关 系 被 假定 为 是 从 学 生 一 教师 比 传导 到 考试 成 绩 。 然 而 ,假设 一 个 政府 最 初 资助 在 考试 
成 绩 差 的 学 区 雇佣 教师 ,如 果 是 这 样 的 话 ,因果 关系 将 是 处 向 的 : 按 通 常 的 教育 推理 , 低 的 学 
生 一 教师 比 会 导致 高 的 考试 成 绩 ,但 是 由 子 该 项 政府 资助 计划 , 低 的 考试 成 绩 也 会 导致 低 的 
学 生 一 教师 比 。 

联 立 因果 关系 导致 了 回 妇 因子 与 误差 项 相关 。 在 考试 成 绩 的 例子 中 ,假设 有 一 个 遗漏 
因素 导致 了 比较 差 的 考试 成 绩 , 由 于 该 项 政府 计划 ,这 个 产生 低 考 试 成 绩 的 因素 反 过 来 又 导 
致 低 的 学 生 一 教师 比 。 因 此 ,在 考试 成 绩 对 学 生 一 教师 比 的 总 体 回归 中 , 负 的 误差 项 降低 了 
考试 成 绩 ,但 是 由 于 该 项 政府 计划 的 作用 , 它 还 导致 了 学 生 一 教师 比 的 降低 。 换 句 话 说 ,在 
总 体 回 时 中 学 生 一 教师 比 与 误差 项 是 正 相 关 的 ,这 反 过 来 又 导致 了 联 立 因果 关系 偏差 和 
DLS 估计 量 的 不 一 致 性 。 

在 数学 上 , 引 人 另 外 一 个 描述 反 向 因果 关系 的 方程 ,能 够 使 误差 项 与 回归 因子 之 间 的 这 
个 相关 关系 变 得 精确 。 为 简便 起 锡 , 只 考虑 两 个 变量 五 和 了 ,而 忽略 其 他 可 能 的 回归 因子 ， 
因此 只 有 两 个 方程 ,一 个 方程 是 半 引 致 Y, 而 另 一 个 方程 是 了 引致 X; 

Y =B,+B,X, +u, (7.3) 
X =y tyYiY, +, (7.4) 

公式 (7.3) 是 我 们 所 熟悉 的 方程 ,其 中 B 是 了 的 变化 对 了 的 影响 ,这 里 代表 其 他 因 
素 。 公 式 (7.4) 表 示 了 对 XY 的 反 向 的 因果 效应 。 在 考试 成 绩 这 个 问题 中 ,公式 (7. 3) 表 示 班 
级 规模 对 考试 成 绩 的 教育 效应 ,而 公式 (7.4) 表示 由 政府 计划 所 引致 的 考试 成 绩 对 班级 规 
模 的 反 向 因果 效应 。 

联 立 因果 关系 导致 了 公式 (7.3) 中 蕊 与 误差 项 的 相关 。 为 了 和 弄 明和 饭 这 一 点 ,假设 
是 负 的 , 它 使 了 减少 。 但 是 ,这 个 较 低 的 了 值 会 通过 第 二 个 方程 影 喧 XX, 的 值 ,而 且 如 果 y 
EEB, BARK Y, 值 会 导致 一 个 低 的 蕊 值 。 因 此 ,如 果 EER, IMAX, Mu 将 会 是 正 
相关 的 ,了 

因为 这 在 数学 上 可 以 用 两 个 联 立 方程 系统 来 表达 ,所 以 联 立 因果 关系 偏差 有 时 被 称 为 
联 立 方程 偏差 {simultanecus equations bias) 。 联 立 因果 关系 偏差 在 重要 概念 7.5 中 总 结 。 

联 立 因果 关系 偏差 的 解决 方法 。 有 两 种 缓和 联 立 因果 关系 偏差 的 方法 :一 种 是 使 用 工 
具 变 量 回 归 , 也 即 第 10 章 的 主题 ; 另 一 种 是 设计 并 实施 一 项 随机 化 控制 实验 ,在 该 试验 中 反 
向 因果 关系 代 道 被 设 为 无 效 , 这 样 的 实验 在 第 11 章 中 讨论 ， 





心 为 了 在 数学 上 证 明 这 一 点 ,注意 会 式 (7.4) 风 售 着 cov( X, st =c yo +y Y, +>, „i, ) =yreov( Y, st) + tovtt,, 
u). Wi covo u.) =0 ,根据 公式 (7.3) ARARE ov (X,,u,) = yo0(Y e} = yowli +B X, +u, ,u,) = y Bi co 
(X,,u,) typo W cov( X, se, JAFE eov X, su) =y] -ybi te 


7.26 OLS 标准 误 不 一 致 性 的 来 源 


不 一 致 的 标准 误 对 内 部 有 效 性 提出 了 不 同 的 威胁 。 即 使 OLS 估计 量 是 一 致 的 ,样本 很 
大 ,不 一 致 的 标准 误 也 将 会 导致 规模 不 同 于 希望 得 到 的 显著 性 水 平 的 假设 检验 , 导致 在 
9%5 名 的 重复 样本 中 不 会 包含 真实 值 的 “95 "的 置信 区 间 。 

存在 不 一 致 的 标准 误 主要 有 两 个 原因 ;对 晃 方 差 的 不 恰当 的 处 理 和 观测 值 之 间 误 差 项 
的 相关 性 。 

异 方差 。 在 4.9 节 中 我 们 已 讨论 过 ,由 于 历史 的 原因 ,一 些 回归 软件 只 报告 同方 差 惟一 
的 标准 误 。 然 而 ,如 果 回 归 误 差 是 异 方差 的 ,那么 ,那些 标准 误 就 不 是 假设 检验 和 团 信 区 间 
估计 的 可 靠 基 础 。 这 个 间 题 的 解决 办 法 是 ,使 用 异 方 差 稳健 性 标准 误 并 使 用 异 方差 稳健 性 
的 方差 估计 胡 来 构造 下 统计 量 。 在 现代 的 软件 包 中 , 蜡 方差 稳健 性 标准 误 是 作为 一 个 选项 
给 出 的 。 


重要 概念 7.5 





联 立 因 果 基 系 偏差 

联 立 因果 关系 偏差 ,又 明 联 立方 程 偏 差 。 在 了 对 工 的 回归 中 ,在 除了 我 们 所 关心 的 从 开 
到 了 的 因 打 关系 以 外 ,还 存在 从 了 到 车 的 因果 关系 时 ,就 会 出 现 联 立 因果 关系 偏 荆 。 这 种 
反 向 的 因果 关系 ,使 得 工 与 我 们 所 研究 的 总 体 回归 中 的 误 善 项 相关 。 

不 同 观 测 值 之 间 误 益 项 的 相关 性 。 在 某 些 设 定 中 ,总 体 回 归 误 差 在 不 同 的 观测 值 之 间 
可 能 是 相关 的 。 如 果 数 据 是 从 总 体 中 随机 抽取 的 ,那么 这 就 不 会 发 生 , 因为 抽样 过 程 的 随机 
性 确保 了 误差 项 在 不 同 的 观测 值 之 间 是 独立 分 布 的 。 不 过 ,抽样 有 时 候 只 是 部 分 随机 的 。 
最 一 般 的 情况 是 ,对 相间 实体 的 数据 随时 间 变化 重复 地 观测 ,例如 ,在 不 同年 份 对 同一 学 区 
进行 重复 观测 。 如 果 构 成 回归 误差 的 遗漏 变量 具有 持久 性 影响 (如 地 区 人 口 统计 特征 ) , 那 
么 这 会 引起 随时 间 变 化 的 回归 误差 的 “序列 ”相关 。 另 一 个 例子 是 当 抽 样 以 地 理 单位 为 基 
础 时 。 如 果 存 在 反映 地 型 影 响 的 遗漏 变量 ,那么 这 些 遗 漏 的 变量 会 导致 相 邻 观测 值 之 间 回 
归 误 差 的 相关 性 。 

不 同 观测 值 之 间 回 归 误差 的 相关 性 不 会 使 0LS 千 计 量 产生 有 偏 性 或 者 是 不 一 致 性 ,但 
是 它 确实 违背 了 重要 概念 5. 4 中 的 第 二 条 最 小 二 乘 假设 条 件 。 结 果 是 ,0LS 标准 误 一 一 不 
管 是 同方 差 惟一 的 标准 误 还 是 异 方差 稳健 的 标准 误 一 一 是 不 正确 的 ,因为 它们 不 能 生成 我 
们 希望 达到 的 置信 水 平 的 置信 区 间 。 

在 许多 情形 下 ,这 个 问题 可 以 通过 使 用 标准 误差 的 一 个 替代 公式 来 解决 。 我 们 给 出 于 
一 个 计算 标准 误 的 公式 , 它 对 第 12 章 时 间 序 列 数据 回归 中 讨论 的 异 方差 和 序列 相关 而 言 都 
是 稳健 的 。 


[7.3_ 例子 :考试 成 绩 和 班级 规模 ] 


内 部 有 效 性 和 外 部 有 效 性 的 内 容 框架 ,可 以 帮助 我 们 用 批判 性 的 眼光 看 一 看 ,我 们 从 对 
加 利 福 尼 亚 州 考试 成 绩 数 据 的 分 析 中 已 经 学 会 了 哪些 ,以 及 我 们 还 有 哪些 没有 学 会 。 


7.3.1 外 部 有 效 性 
加 利 福 尼 亚 州 的 分 析 能 否 被 推广 , 即 它 是 否 是 外 部 有 效 的 , 依 束 于 被 推广 到 其 中 的 总 体 
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一 般 模 式 也 存在 于 马萨诸塞 州 的 数据 中 。 然 而 ,描述 这 个 非 线 性 的 最 佳 的 函 教 形式 却 不 相 
同 , 蕊 萨 渚 塞 州 是 三 次 设 定 拟 合 得 最 好 ,而 加 利 福 尼 亚 州 是 线性 对 数 设 定 拟 合 得 最 好 。 
考试 成 线 
780 


线性 回归 
760 线性 对 数 回归 \ 











注 :所 估计 的 线性 回归 函数 没有 捕捉 到 马萨诸塞 州 数据 中 收入 和 考试 成 绩 之 条 的 非 线性 关系 。 对 

地 区 收入 在 13 000 美元 ~ 30 000 美元 之 间 的 包含 大 部 分 观测 值 的 地 区 而 言 ,所 估计 的 线性 对 数 和 三 次 
回归 基数 是 相似 的 。 
图 7 一 !” 马 萨 诸 赛 州 数 据 中 考试 成 绩 与 收入 间 的 关系 

多 元 辐 昭 结果。 马萨诸塞 州 数 据 的 回归 结果 在 表 7 一 2 中 给 出 。 表 的 第 (1 ) 列 报告 了 
第 一 个 回归 , 即 只 把 学 生 一 教师 比 作 为 回归 因子 。 和 斜率 是 负 的 ( -1.72) ,并 且 系 数 为 零 的 
假设 在 1 免 的 显著 性 水 平 下 被 拒绝 (1 = -1.72/0.50 = -3.44)。 

表 中 其 余 的 列 , 报 告 了 包含 控制 学 生 特征 的 额外 变量 和 将 非 线性 引 人 到 所 千 计 的 合 归 
函数 中 的 分 析 结果 。 控 制 英语 学 习 者 的 百分比 .享受 免费 午餐 计划 学 生 的 百分比 之 后 ,地 区 
平均 收入 使 学 生 一 教师 比 的 估计 系数 降低 了 60% ,从 回归 (1) 中 的 -1.72 到 回归 (2) 中 的 
- 0, 的 和 回归 (3) 中 的 -0.564。 

比较 回归 (2) AEG) PH R 值 ,说 明 即 使 在 保持 学 生 一 教师 比 不 变 的 情况 于 ,三 次 
设 定 (3) 提 供 了 一 个 比 对 数 设 定 (2) 更 好 的 关于 考试 成 绩 和 收入 之 间 关 系 的 模型 。 在 统计 
上 ,不 存在 考试 成 绩 和 学 生 一 老师 比 之 间 非 线性 关系 的 显著 证 据 :回归 (4) 中 检验 STR 和 
STE 的 总 体系 数 是 否 都 为 零 的 下 统计 量 的 P 值 为 0 641。 同 理 , 在 统计 上 也 并 不 存在 充分 
的 证 据 表 明 降 低 学 生 -- 老 师 比 在 英语 学 习 者 很 多 的 地 区 和 很 少 的 地 区 之 间 具 有 不 同 的 影响 
(回归 (5) 中 MEL xSTR 的 上 统计 量 为 0.80/0. 56 = 1.43)。 最 后 ,回归 (6) 表 明 , 当 英语 学 习 
者 的 百分比 ! 它 在 回归 (3) 中 是 不 显著 的 ) 被 剔除 掉 时 ,学 生 一 教师 比 的 估计 系数 没有 发 生 
实质 性 的 变化 。 简 而 言 之 ,在 表 7 一 2 中 ,回归 (3 ) 的 结果 对 回归 (4) ~ 回归 (6) 中 所 考虑 的 
函数 形式 和 设 定 的 变化 不 敏感 。 因 此 ,我 们 采用 回归 (3 ) 作 为 分 析 马 萨 诸 塞 州 数 据 中 学 生 
一 数 师 比 的 变化 对 考试 成 绩 影 响 的 基准 估计 方法 。 

马萨诸塞 州 分 析 结 果 与 加利福尼亚 州 分 析 结果 的 比较 。 通 过 对 加 利 福 尼 亚 州 数据 的 研 
究 , 我 们 发 现 : 

























































































表 7 一 2 学 生 一 教师 比 和 考试 成 绩 的 多 元 同 归 估 计 ( 数 据 来 自 于 马 萨 诸 诸 州 ) 
因 净 量 : 学 区 内 内 年 级 学 生 的 英语 .数学 和 科学 的 娘 合 平均 考试 成 绩 ;220 个 观测 值 
PEI f (I) 12} (3) (4) (5) (6) 
学 生 一 教师 比 -1.72"” -069” -0.64° 12. 4 -1 02** -0.67° 
(STR) (0.50) (0.27) (0.27) (14.0) (037) (0.27) 
(STR) -0. 680 
(0.737) 
(STR) 0.011 
(0.013) 
英语 学 习 者 的 百分比 -0.411 -0.437  -0.434 
(0.306) (0.303) (0.300) 
英语 学 习 者 的 百分比 > 中 位 数 ? -12.6 
(二 元 变量 ,HiEL) (9.8) 
HEL x STR 0. 80 
(0.56) 
享受 免费 午餐 计划 -0.521°* —0.582"* -0.587°° -0.709°* -0.653"° 
的 学 生 的 百分比 (0.077) (0.097) (0.104) (0.091) (0.72) 
地 区 收入 { 对 数 ) 16.53" ° 
(3.15) 
地 区 收入 -3,07 -3.38 -387° -322 
(2.35) (2.49) (249) (2.31) 
地 区 上 收入? 0. 164 0.174 0.184° 0.165 
(0.085) (0.089) (0.090) (0.085) 
地 区 收入 -0.0022° -0.0023° -0.0023* -0. 0022 
《0.0010) (0.0010) (0.0010) (0.0010) 
RE 739.6" 682.4" 744.07" 665.5%% 759.9% 7A 
(8.6) {11.5) (21.3) (81.3) (23.2) (20.3) 
检验 删除 变量 组 屎 统计 二 和 产值 
所 有 STREH 2.86 4.01 
MEAM = 0 (0.038) (0.020) 
STR STR = 0 0.45 
(0.641) 
Income” Income =0 7.74 7.75 5.85 6.55 
( <0.001) (<0.001} (0.003) (0.002) 
HiEL ,HiEL x STR 1. 58 
(0.208) 
SER 14.64 8. 69 8.61 8.63 8. 62 8.61 
m 006 — 0670 0.676 0.675 065 0674 





注 :这 些 回归 是 用 附录 7.1 中 所 描述 的 马萨诸塞 州 小 学 学 区 前 数据 进行 估计 的 。 标 准 误 在 系数 下 面 
的 括号 中 给 出 ,p 值 在 三 统 计量 下 面 的 括号 中 给 出 。 单 个 系数 在 "5 旬 或 “1 名 的 水 平 下 在 统计 上 是 亚 
FH. 


a 添加 控制 学 生 背 景 特征 的 变量 使 学 生 一 教师 比 的 系数 从 -2. 28( 表 5 一 2 中 的 回归 
(1) ) 降 到 -0.73(& 6—3 中 的 回归 (2) ) ,降低 了 68% , 

b. 学 生 一 教师 比 的 真实 系数 为 零 的 假设 在 1% 的 显著 性 水 平 下 被 拒绝 ,即使 在 添加 了 
控制 学 生 背 景 和 地 区 经 济 特征 的 变量 之 后 亦 如 此 。 

e. 前 减 学 生 一 教师 比 的 效应 并 不 十 分 俱 束 于 该 地 区 英语 学 习 者 的 泊 分 比 。 

d. 有 些 证 据 表 明 考试 成 绩 和 学 生 一 教师 比 之 间 的 关系 是 非 线性 的 。 

在 马虎 诸 塞 州 的 数据 中 我 们 是 否 发 现 了 相 问 的 结论 呢 ? 对 于 结论 (a) .(b) 和 (c) ,答案 
是 肯定 的 。 包 含 额 外 的 控制 变量 使 学 生 一 教师 比 的 系数 从 - 1.72( 表 ?一 2 中 的 回归 (1) ) 
降 到 -0. 69( 表 ?7 一 2 中 的 回归 (2) ) ,降低 了 邱 多。 学 生 一 教师 比 的 系数 在 添加 了 控制 变 基 
后 仍然 显著 。 在 马萨诸塞 州 的 数据 中 ,那些 系数 仅 在 5 免 的 水 证 下 是 显著 的 ,而 在 加 利 福 尼 
亚 州 的 数据 中 ,它们 在 1 台 的 水 平 下 是 显著 的 。 然 而 ,加 利 福 尼 亚 州 的 数据 有 近 两 倍 于 马 僚 
诸 塞 州 的 观测 值 ,所 以 加 利 柱 尼 亚 州 的 估计 值 更 精确 就 不 足 为 奇 了 。 和 在 加 利 福 尼 亚 州 的 
数据 中 一 样 ,在 马萨诸塞 州 的 数据 中 ,不 存在 关于 学 生 一 教师 比 和 表示 地 区 英语 学 习 者 百 分 
比 大 小 的 二 元 变量 之 间 交 互 作用 的 在 统计 上 的 显著 性 证 据 。 

可 是 ,结论 (d) 在 马萨诸塞 州 的 数据 中 并 不 成 立 : 当 针 对 三 次 设 定 进行 检验 时 ,学 生 一 
教师 比 和 考试 成 绩 之 间 的 关系 是 线性 的 这 一 假设 在 5 名 的 显著 人 性 水 平 下 不 能 被 拒绝 。 

由 于 这 两 个 标准 化 考试 是 不 同 的 ,因此 系数 本 身 不 能 直接 进行 比较 :马萨诸塞 州 考试 的 
1 分 与 加 利 福 尼 让 州 考试 的 1 分 是 不 同 的 。 不 过 ,如 果 将 考试 成 绩 转化 为 相同 的 单位 ,那么 
所 估计 的 班级 规模 效应 就 能 够 进行 比较 了 。 如 此 做 的 一 种 方法 是 将 考试 成 绩 进 行 标准 化 转 
换 , 即 分 数 减 去 样本 平均 值 ,然后 再 除 以 标准 差 ,所 得 结果 具有 均值 为 0 和 方差 为 1 的 特征 。 
在 对 转换 后 的 考试 成 绩 的 回归 中 ,斜率 系数 等 于 初始 回归 中 的 斜率 系数 除 以 考试 成 绩 的 标 
谁 差 。 因 此 , 除 以 考试 成 绩 标准 差 之 后 的 学 生 一 教师 比 的 系数 就 可 以 在 两 个 数据 集 之 间 进 
行 比较 了 。 

这 个 比较 在 表 7 一 3 中 进行 。 表 的 第 1 列 报告 了 在 具有 包含 英语 学 习 者 的 百分比 .享受 
免费 午餐 计划 学 生 的 百分比 和 平均 地 区 收入 作为 控制 变量 的 回归 中 的 学 生 一 教师 比 系数 的 
OLS 估计 值 。 第 2 列 报告 了 考试 成 绩 在 各 地 区 间 的 标准 差 。 最 后 两 列 报告 了 学 生 一 教师 比 
降低 2 个 单位 ( 即 我 们 教育 主管 的 建议 ) 对 考试 成 绩 的 估计 效应 ,第 1 列 用 考试 成 绩 为 单位 
进行 表示 ,第 2 列 用 标准 差 为 单位 进行 表示 。 对 于 线性 设 定 ,使 用 加 利 福 尼 亚 州 数据 的 OLS 
系数 估计 值 为 -0.73, 因 此 以 学 生 一 教师 比 前 减 2 个 单位 会 使 地 区 考试 成 绩 提高 ( -0.73) 

x( -2) =1.46 分 。 考试 成 绩 的 标准 差 是 19.1 分 , 它 对 应 于 1. 46719.1 =0.076 个 地 区 闻 
考试 成 绩 分 布 的 标准 差 。 这 个 估计 值 的 标准 误 为 0. 26 x2719. 1 =0.027。 非 线性 模型 的 导 
计 效 应 及 其 标准 误 用 6. 1 节 中 所 介绍 的 方法 进行 计算 。 

根据 使 用 加 利 福 尼 亚 州 数据 的 线性 模型 ,估计 学 生 一 教师 比 减少 2 个 单位 会 使 考试 成 
绩 提 高 0.076 个 标准 差 单位 ,其 标准 误 为 0.027。 加 利 福 尼 亚 州 数据 的 非 线性 模型 表明 了 
稍微 大 一 些 的 效应 ,其 具体 效应 依赖 于 初始 的 学 生 一 教师 比 。 基 于 马萨诸塞 州 的 数据 ,这 个 
估计 效应 为 0. 085 个 标准 差 单位 ,其 标准 误 为 0. 036。 

这 些 佑 计 值 基本 土 是 相同 的 ,预测 削减 学 生 一 教师 比 会 提高 考试 成 绩 ,但 是 预测 的 改进 
幅度 很 小 。 例 如 ,在 吉利 福 尼 亚 州 的 数据 中 ,在 中 位 数 地 区 和 第 75 位 百 分 位 数 地 区 之 间 的 
考试 成 绩 之 差 为 12.2 分 ( 表 4 一 1) 或 0.64(12.2719.1) 个 标准 差 。 来 自 于 线性 模型 的 估计 
效应 仅仅 超过 这 个 规模 的 1710, 挽 和 名 话说 ,根据 这 个 估计 值 ,学 生 一 教师 比 前 减 2 个 单位 内 
会 使 该 地 区 在 地 区 间 考 试 成 绩 分 布 的 中 位 数 到 第 75 位 百 分 位 数 之 间 的 方向 土 移动 1/10。 








变 基 误 兰 。 地 区 平均 学 生 一 教师 比 是 班级 规模 的 一 个 宽泛 的 ,不 精确 的 潜在 测度 。 例 
如 ,由 于 学 生 经 常 在 地 区 间 迁 移 , 学 生 一 教师 比 可 能 不 准确 地 摘 述 了 参加 考试 的 学 生 所 经 历 
的 实际 班级 规模 , 它 反 过 来 会 导致 所 估计 的 班级 规模 效应 偏向 于 零 。 另 一 个 具有 潜在 测量 
误差 的 变量 是 地 区 平均 收入 。 那 些 数 据 取 自 于 1990 年 的 人 口 普查 ,而 其 他 数据 取 自 于 
1998 年 { 马萨诸塞 州 ) 和 1999 年 {加利福尼亚 州 )。 如 果 该 地 区 的 经 济 结构 在 20 世纪 90 年 
代 发 生 了 巨大 变化 ,那么 这 将 会 是 实际 地 区 平均 收入 的 不 精确 测度 。 

选择 。 加 利 福 尼 亚 州 和 马萨诸塞 州 的 数据 涵盖 了 州 内 所 有 满足 最 低 规模 约束 的 公立 小 
学 学 区 ,因此 没有 理由 认为 这 里 的 样本 选择 有 问题 。 

联 立 因果 关系 。 如 果 标 准 化 考试 的 成 绩 影 响 学 生 一 教师 比 ,那么 联 立 因果 关系 就 会 出 
现 。 例 如 ,如 果 某 些 官僚 机 构 或 政治 机 制 对 成 绩 差 的 学 校 或 地 区 增加 资助 ,这 会 导致 这 些 学 
校 和 地 区 雇佣 更 多 的 教师 ,那么 联 立 因果 关系 就 可 能 发 生 。 在 这 些 考试 期 间 内 ,马萨诸塞 州 
不 存在 使 学 校 资助 均等 化 的 机 制 。 在 加 利 福 尼 亚 州 ,一 系列 法 律 案例 表明 存在 一 些 资助 均 
等 化 现象 ,但 是 这 种 资助 的 再 分 配 并 不 是 以 学 生 的 成 绩 为 基础 的 。 因 此 ,在 马萨诸塞 州 和 加 
利 福 尼 亚 州 , 联 立 因果 关系 看 上 去 并 不 是 个 问题 。 

红 方 差 以 及 不 同 观测 值 之 问 误差 项 的 相关 性 。 这 里 和 前 面 章节 中 给 出 的 所 有 结果 都 使 
用 了 异 方 差 稳健 的 标准 误 , 因 此 , 蜡 方差 不 会 威胁 到 内 部 有 效 性 。 然 而 ,由 于 没有 使 用 简单 
随机 抽样 (样本 由 州 内 所 有 的 小 学 学 区 组 成 ) ,因此 观测 什 之 间 误 差 项 相关 可 能 会 威胁 到 标 
准 误 的 一 至 性 。 尽 管 存在 能 够 应 用 于 这 种 情形 的 其 他 形式 的 标准 误 公 式 , 但 是 细节 过 于 复 
杂 且 专业 化 ,我 们 将 它们 留 在 更 高 级 的 课本 中 学 习 。 


7.3.3 讨论 和 含义 


马萨诸塞 州 和 加 利 福 尼 亚 州 的 分 析 结 果 之 间 的 相似 性 表明 ,这 些 研究 结论 是 外 部 有 效 
的 ,也 就 是 说 , 主要 的 结论 能 被 锥 广 到 美国 其 他 小 学 学 区 的 标准 化 考试 成 绩 中 。 

通过 控制 学 生 背 景 ,家庭 经 济 背景 和 地 区 的 富裕 程度 ,通过 检查 回 妇 函数 中 的 非 线性 特 
征 , 对 内 部 有 效 性 的 最 重要 的 一 些 潜在 威 肪 已 被 解决 了 。 不 过 ,一 些 潜在 的 对 内 部 有 效 性 的 
威胁 还 仍然 在 在 。 一 个 主要 的 可 能 威胁 是 遗漏 变量 偏差 , 它 可 能 会 因为 控制 变量 没有 捕 提 
到 学 区 的 其 他 特征 或 课外 学 习 机 会 而 产生 。 

根据 加 利 福 尼 亚 州 和 马萨诸塞 州 的 数据 ,我 们 能 够 解答 4. 1 节 中 教育 主管 的 问题 ;在 控 
制 了 家 庭 经 济 背景 ,学 生 特 征 和 地 区 的 富裕 程度 之 后 , 且 在 建立 了 回归 函数 的 非 线性 模型 之 
后 ,预测 以 2 个 单位 的 幅度 削减 学 生 一 教师 比 , 会 使 考试 成 线 大 约 提高 0. 08 个 地 区 间 考 试 
成 绩 分 布 的 标准 差 。 这 个 效应 在 统计 上 是 显著 的 ,但 是 它 非 常 小 。 这 个 小 的 估计 效应 与 许 
多 已 经 完成 的 班级 规模 降低 对 考试 成 绩效 应 的 研究 结果 相 一 致 。 

教育 主管 现在 能 使 用 这 个 估计 值 来 帮助 她 决定 是 否 减 小 班级 规模 。 在 做 这 个 决策 时 ， 
她 需要 权衡 预计 减少 的 成 本 和 利益 。 成 本 包括 教师 的 工资 和 增加 教室 的 费用 ,利益 包括 提 
高 学 习 成 绩 , 我 们 已 用 标准 化 考试 成 绩 来 测度 了 ,但 是 还 有 其 他 潜在 的 利益 我 们 没有 研究 ， 
包括 较 低 的 辍学 率 和 提高 未 来 收入 。 所 建议 的 缩减 对 标准 化 考试 成 绩 的 估计 效应 是 她 计算 
成 本 和 利益 的 一 个 重要 的 考虑 因素 。 


ao RN TREERE ARA SISAKUNA 的 关系 感 兴 趣 , 参 看 Ehrenberg, Brewer, Gamoran 与 Willma 的 评论 








-7.4 ”结论 


内 部 有 效 性 和 外 部 有 效 性 的 概念 为 评估 从 经 济 计量 学 研究 中 所 学 到 的 东西 提供 了 一 个 
框架 。 

如 果 估计 的 系数 是 无 偏 的 一致 的 ,而 且 标 准 误 也 是 一 致 的 ,那么 基于 多 元 回归 研究 得 
出 的 结论 就 是 内 部 有 效 的 。 对 这 种 研究 的 内 部 有 效 性 产生 威胁 的 因素 包括 遗 湄 变量 .函数 
形式 误 定 ( 非 线性 ) . 自 变量 的 不 精确 测量 { 变量 误差 ) ,样本 选择 及 联 立 因果 关系 。 每 一 种 
威胁 都 会 引起 回归 因子 与 谋 差 项 之 间 的 相关 ,这 反 过 来 会 使 OLS 佑 计量 有 偏 且 相 一致。 如 
果 观 测 慎 之 间 误 差 项 相关 ,就 像 它们 在 时 间 序 列 数 据 中 可 能 会 的 那样 ,或 如 果 它 们 基 蜡 方差 
的 ,但 是 标准 误 却 是 用 向 方差 惟一 的 公式 计算 的 ,那么 内 部 有 效 性 就 受到 了 损害 ,因为 标准 
误 将 会 是 不 一 致 的 。 后 面 的 这 些 问 题 可 通过 从 当地 计算 标准 误 来 解决 。 

如 果 一 项 研究 的 发 现 可 被 推广 到 所 研究 的 总 体 和 环境 设 定之 外 ,那么 和 任何 统计 研究 
一 样 ,使 用 回归 分 本 的 该 项 研究 是 外 部 有 效 的 。 有 时 , 它 能 有 有 动 于 比较 两 个 或 多 个 同一 主题 
的 研究 。 然 面 ,不 论 是 否 存 在 两 个 或 多 个 这 样 的 研究 ,评价 外 部 有 效 性 需要 对 所 研究 的 总 体 
利 环境 设 定 与 结论 被 推广 到 的 总 体 和 环境 设 定 的 相似 性 进行 判断 。 

本 书 接 下 来 的 两 部 分 将 提出 解决 那些 不 能 单独 由 多 元 回归 分 析 来 缓和 的 对 内 部 有 效 性 
有 威胁 的 方法 。 第 3 部 分 以 缓和 OLS 情 计 量 中 所 有 这 五 个 潜在 偏差 来 源 为 目的 扩展 了 争 
元 回归 模型 ;第 3 部 分 还 讨论 了 一 种 获得 内 部 有 效 人 性 和 随机 化 控制 实验 的 不 同方 法 。 第 4 
部 分 提出 了 分 析 时 间 序 列 数据 和 使 用 时 间 序 列 数 据 来 估计 所 谓 的 动态 因果 效应 ( 它 是 随时 
间 变 化 的 因果 效应 ) 的 方法 。 





r A Za 


1. 评价 一 项 统计 研究 成 果 , 可 通过 询问 该 成 果 是 否 达到 内 部 有 效 和 外 部 有 效 来 实现 。 
如 果 一 项 对 因果 效应 的 统计 推断 对 所 研究 的 总 体 而 言 是 有 效 的 ,那么 该 项 研究 是 内 部 有 效 
的 。 如 果 该 推断 和 结论 能 从 所 研究 的 总 体 和 环境 设 定 推广 到 其 他 的 总 体 和 环境 设 定 ,那么 
该 项 研究 是 外 部 有 效 的 。 

2. 在 回归 分 析 中 ,对 内 部 有 效 性 存在 两 个 主要 的 威胁 :第 一 ,如 果 回 归 因 子 与 误差 项 是 
相关 的 ,那么 OLS 估计 旱 将 会 是 不 一 致 的 ;第 二 , 当 标 准 误 不 正确 时 ,置信 区 间 和 假设 检验 
是 无 效 的 。 

3. 当 存在 遗 潮 变 量 .不 正确 的 函数 形式 .一 个 或 多 个 回归 因子 有 测量 误差 ,样本 个 是 从 
总 体 中 随机 选择 的 ,或 者 回归 因子 与 因 变 量 之 间 存 在 联 立 因果 关系 时 ,回归 因 了 于 和 误差 项 之 
间 就 可 能 相关 。 

4. 当 误 差 项 是 异 方差 的 ,而 计算 机 软件 却 使 用 同方 差 惟 一 的 标准 误 时 ,或 者 当 误 差 项 
在 不 同 的 观测 值 之 间 相 关 时 ,标准 误 就 是 不 正确 的 。 


p BERE 
研究 总 体 ” 感 兴趣 的 总 体 ” 内 部 有 效 性 ”外 部 有 效 性 ”函数 形式 误 定 ”变量 误差 偏差 
样本 选择 偏差 ” 联 立 因果 关系 ” 联 立方 程 偏差 





[复习 概念 


7.1 内 部 有 效 性 与 外 部 有 效 性 之 间 的 区 别 是 什么 ? 研究 的 总 体 和 感 兴趣 的 总 体 之 间 
的 区 曾 又 是 什么 ? 

7.2 根据 偏差 与 方差 之 间 的 权衡 ,重要 概念 7.2 解释 了 变量 选择 问题 。 这 个 权衡 是 什 
么 意思 ? 为 什么 包含 一 个 额外 的 回归 因子 能 够 降低 偏差 ”为 什么 会 增加 方差 ? 

7.3 经济 变 量 经 常 带 有 测量 误差 ,这 是 否 意味 着 回归 分 析 是 不 可 靠 的 ? 请 说 明理 由 。 

7.4 ”假设 一 个 州 向 州 内 所 有 的 三 年 级 学 生 提供 自愿 的 标准 化 考试 ,而 且 这 些 数据 被 用 
于 班级 规模 对 学 生成 绩 影响 的 研究 中 。 请 解释 样本 选择 偏差 是 怎样 使 研究 结果 变 得 无 
效 的 。 

7.5 一 名 研究 人 员 利 用 城市 水 平 的 数据 估计 了 警察 经 费 支出 对 于 犯罪 率 的 影响 。 请 
解释 联 立 因果 关系 是 怎样 使 研究 结果 变 得 无 效 的 。 

7.6 一 名 研究 人 员 使 用 两 个 不 赔 的 软件 包 和 估计 同一 个 加 归 。 第 一 个 软件 包 使 用 了 辣 
方差 惟一 的 公式 计算 标准 误 , 第 二 个 软件 包 使 用 了 蜡 方差 稳健 的 公式 计算 标准 误 。 这 两 个 
标准 误 非 常 不 同 , 你 该 使 用 哪 一 个 ? 为什么? 





[练习 ] 


"7. 1 根 设 你 刚 阅 读 了 一 份 非常 细致 的 关于 广告 宣传 对 香烟 需求 效应 的 统计 研究 。 
该 研究 使 用 的 是 来 自 于 纽约 州 20 世纪 70 年 代 期 间 的 数据 ,研究 结论 是 :公共 汽车 和 地 铁 上 
的 广告 比 印 册 广告 更 有 效 。 和 使用 外 部 有 效 性 的 概念 来 确定 这 些 结果 是 否 有 可 能 被 用 于 20 
世纪 70 年 代 的 波士顿 地 区 .20 世纪 70 年 代 的 洛杉矶 .2002 年 的 纽约 。 

7.2” 考 虚 单 变量 回归 模型 :Y, = Bo +B X, +, 并 假设 它 满足 重要 概念 4.3 中 的 假设 。 


RY 有 测量 误差 ,因此 数据 是 = 了 +w, AEK u 是 测量 误差 , 它 是 独立 同 分 布 的 , 且 独 


立 于 了 和 马 。 考 虑 总 体 回归 画 数 全 =p, +B.X +w ,这 里 w 是 使 用 了 错误 测量 的 因 变 量 了 
的 回归 误差 。 

a. 证 上 朋 ;w =u, twa 

b. IE: B Ë =A +B X, +, 满足 重要 概念 4. 3 中 的 假设 (假设 对 任意 的 i 和 j Aw, 
独立 于 了 和 大 ,并 且 具 有 有 限 的 四 阶 矩 ) 。 

c OLS 估计 量 是 一 致 的 吗 ? 

d. 能 用 通常 的 方法 来 构造 置信 区 和 疗 吗 ? 

e 评价 这 句 话 ; “变量 的 测量 误差 是 个 严重 的 问题 ,而 变量 了 的 测量 误差 划 不 是 。" 

7.3 ”研究 妇女 收入 决定 因素 的 劳动 经 济 学 家 们 发 现 了 一 个 使 和 困惑 的 实证 结果 。 选 
用 随机 选择 的 受 雇佣 妇女 ,他 们 用 收 人 对 妇女 的 孩子 数 和 一 系列 的 控制 变量 ( 年龄 ,学历 、 
职业 等 ) 进 行 回归 。 他 们 发 现在 控制 这 些 其 他 因素 不 变 的 情况 下 ,有 较 多 孩子 的 女性 有 较 
高 的 工资 。 解 释 样 本 选择 如 何 有 可 能 成 为 导致 这 种 结果 的 原因 。( 提示 ;注意 样本 仅 包括 
在 职 的 妇女 .)( 这 个 实证 难题 激发 了 James Heckman 对 样本 选择 的 研究 ,使 他 因此 获得 了 
2000 年 诺 贝尔 经 济 学 奖 ) 








-附录 马萨诸塞 州 小 学 的 考试 数据 


马萨诸塞 州 的 数据 是 1998 年 公立 小 学 学 区 的 地 区 范围 内 的 平均 值 。 考 试 成 绩 取 自 于 
1998 年 春季 马 萨 渚 塞 州 公立 学 校 中 所 有 的 四 年 级 学 生 进行 的 马萨诸塞 州 综 合 评估 系统 
(MCAS) 考 试 。 这 个 考试 是 由 马萨诸塞 州 教 育 部 门 主办 的 , 且 对 所 有 的 公立 学 校 都 是 强制 
性 的 。 这 里 分 析 的 数据 是 整体 的 总 分 数 , 它 是 考试 中 的 英语 .数学 和 科学 部 分 的 分 数 之 和 。 

学 生 一 教师 比 .享受 午餐 补助 计划 的 学 生 的 百分比 和 仍 在 学 习 英 语 的 学 生 的 百分比 的 
数据 ,是 1997—1998 学 年 里 每 个 小 学 的 平均 数 .而且 是 从 马萨诸塞 州 教育 部 门 取得 的 。 地 
区 平均 收 人 数据 是 从 1990 年 美国 人 口 普查 数据 中 得 到 的 。 
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多 元 回归 是 控制 变量 影响 的 一 种 有 力 的 工具 ,当然 这 里 的 变量 我 们 需要 掌握 其 数据 。 
然而 ,如 采 得 不 到 一 些 变量 的 数据 ,那么 它们 就 不 能 包 插 在 回归 中 ,回归 系数 的 OLS kit + 
就 可 能 含有 遗 湄 变量 偏差 。 

本 章 描述 了 控制 某 些 类 型 遗漏 变量 (不 用 实际 观测 它们 ) 的 一 种 方法 。 该 方法 要 求 一 
种 特殊 类 型 的 数据 ,这 种 数据 被 称 为 面板 数据 。 在 面板 数据 中 ,每 个 观测 单 性 或 实体 在 两 个 
或 两 个 以 上 时 期 被 观测 。 研 究 因 变量 随时 间 的 变化 ,有 可 能 消除 那些 在 观测 单位 之 间 有 差 
异 但 随时 间 不 变 的 遗漏 变量 的 影响 。 

本 章 中 的 实证 应 用 的 例子 是 关于 醉酒 蜀 车 : 酒 税 和 醉酒 蜀 革 法 对 普通 事故 死亡 率 的 彩 
ARAA? 我 们 用 美国 48 个 四邻 的 州 1982 年 到 1988 年 这 ?7 年 间 每 一 年 的 交通 事故 死亡 
当 \ 酒 税 .醉酒 驾 夺 法 以 及 有 关 的 变量 处 理 这 个 问题 。 这 个 面板 数据 集 驳 许 我 们 控制 那些 难 
以 观测 的 变量 ,比如 对 饮酒 和 驾车 的 普遍 态度 。 这 些 难以 观测 的 变量 在 州 之 间 不 同 但 不 随 
时 间 变 化 。 面 板 数 据 也 克 许 我 们 控制 那些 随时 间 变 化 但 在 各 败 之 间 不 发 生变 化 的 变 晤 , 像 
新 车 安全 措施 的 改善 等 。 

8.1 节 描 述 了 面板 数据 结构 , 放 引 入 了 醉酒 贺 夺 数据 集 。 固 定 效应 回归 ,作为 面板 数据 
回归 分 析 的 主要 工具 ,是 多 元 回归 的 一 种 推广 ,这 科 方 法 利用 面板 数据 来 控制 那些 在 观测 单 
性 之 间 不 同 但 随时 间 变 化 悍 村 不 变 的 变量 。8.2 节 和 8.3 节 介 绍 了 固定 效应 回归 ,首先 介 
绍 了 只 有 两 个 时 期 的 情形 ,然后 介绍 了 多 个 时 期 的 情形 。 在 8.4 节 ,这 些 方 法 被 扩展 且 合 并 
了 所 谓 的 时 间 固 定 获 应 ,这 个 时间 固 定 效 应 控制 了 那些 在 观测 单位 之 间 不 变 介 了 瑚 时 间 变 化 
的 不 可 观测 的 变量 。 在 8.5 节 , 我 们 使 用 这 些 方法 研究 酒 税 和 醉酒 田 车 法 对 交通 事故 死亡 
人 数 的 彩 响 。 





[8.1 面板 数据 - 


回想 在 1. 3 节 中 曾 指出 ,面板 数据 { panel data ,也 称 为 纵向 数据 ) 是 指 个 不 同 实体 在 
了 个 不 同时 期 被 观测 的 数据 。 本 章 所 研究 的 州 交 通 事 故 死亡 率 数据 就 是 面板 数据 。 这 些 数 











据 是 nm =48 个 实体 ( 州 ) ,其 中 每 个 实体 被 观测 T =7 个 时 期 (年 份 为 1982 年 ,……,1988 
年 ) ,总 共有 7x48 =336 个 观测 值 。 

在 描述 截面 数据 时 ,使 用 下 角 标 来 表示 实体 是 很 有 用 的 ,例如 了 是 指 第 ;个 实体 变量 
Y。 在 措 述 面板 数据 时 ,我 们 需要 一 些 额外 的 符号 标明 实体 和 时 期 ,通过 使 用 两 个 下 角 标 而 
不 是 一 个 下 角 标 就 能 够 做 到 :第 一 个 下 角 标 i 是 指 实 体 ,第 二 个 下 骨 标 t 是 指 观测 的 时 期 。 
这 样 ,了 ,就 表示 个 实体 中 第 i 个 实体 在 了 个 时 期 中 第 :个 时 期 被 观测 到 的 变量 了 。 这 个 符 
SERRAS S8 1 中 作 了 总 结 。 


重要 概念 8. 1 


画板 数据 的 符号 衷 示 

画板 数据 由 同样 的 个 实体 罕 两 期 域 两 期 以 上 的 观测 值 所 组 成 。 如 果 数 据 集 包含 变量 
三 和 了 了 的 观测 值 ,那么 数据 可 表示 为 : 

(EF) 1 nt (8.1) 
其 中 ,第 一 个 下 角 标 i 指 被 观测 的 实体 ,第 二 个 下 角 标 : 指 被 观测 的 时 期 。 

与 面板 数据 有 关 的 一 些 额 外 术语 描述 了 是 否 缺 少 一 些 观测 值 。 均 衡 面板 {balanced 
panel) 含有 所 有 的 观测 值 , 也 就 是 说 ,变量 对 每 个 实体 在 每 个 时 期 都 进行 了 观测 。 一 个 古板 
对 至 少 一 个 实体 在 至 少 一 个 时 期 缺失 数据 , 则 该 面板 被 称 为 非 均衡 面板 { unbalanced 
panel] 。 由 于 交通 事故 死亡 率 数 据 集 含有 美国 所 有 的 48 个 州 在 整个 7 年 的 数据 ,因此 它 是 
均衡 的 。 然 而 ,如 果 有 些 数据 缺少 了 (例如 ,如 果 我 们 没有 某 些 州 在 1983 年 的 死亡 率 数 
据 ) ,那么 数据 集 就 是 非 均 衡 的 。 本 章 所 提 到 的 方法 是 针对 均衡 面 极 来 介绍 的 ,不 过 ,所 有 
这 些 方法 都 能 被 用 于 非 均衡 面板 ,尽管 实际 上 如 何 准确 地 去 做 取决 于 所 使 用 的 回归 软件 。 


例子 :交通 死亡 与 酒 税 


在 美国 ,每 年 大 约 有 40 000 例 高 速 公路 交通 死亡 事故 。 大 约 173 的 致命 性 撞车 汪 故 涉 
及 司机 醉酒 驾车 , 面 且 这 个 比例 在 饮酒 高 峰 期 会 上 升 。 一 项 研究 ( Levitt 与 Porter, 2000 ) Ë 
H ERALAR 点 之 间 ,行驶 在 公路 上 的 司机 有 5% 饮 过 酒 ,而 饮酒 的 司机 会 造成 致命 
撞车 事故 的 可 能 性 至 少 是 没有 饮酒 司机 的 13 倍 。 

在 本 章 , 我 们 研究 了 设计 用 来 劝阻 醉酒 驾车 的 各 种 政府 政策 在 减少 交通 死亡 方面 的 实 
际 效果 如 何 。 面 板 数据 集 包 含 了 与 交通 死亡 率 和 酒 有 关 的 变量 ,包括 每 个 州 每 年 交通 事故 
的 死亡 人 数 .醉酒 驾车 法 以 及 每 个 州 的 啤酒 税 。 我 们 所 使 用 的 交通 死亡 测度 是 事故 死亡 率 ， 
它 大 在 该 州 总 人 口中 每 10 000 人 的 年 度 交通 事故 死亡 人 数 。 我 们 所 使 用 的 酒 税 测度 是 一 
箱 啤酒 的 “实际 ” 税 , 它 是 经 通货 鹏 胀 调整 转化 为 1988 年 美元 ?的 啤酒 税 。 在 附录 8. 1 中 ， 
更 详细 地 介绍 了 这 个 数据 。 

图 8 一 L(a) 是 这 些 变量 中 的 两 个 变量 , 即 事故 死亡 率 和 每 箱 啤 酒 的 实际 税 在 1982 年 数 
据 的 敬 点 图 。 这 个 散 点 图 上 的 点 表示 某 个 给 定 的 州 1982 年 的 事故 死亡 率 和 实际 婢 酒 税 。 
用 事故 死亡 率 对 实际 路 酒 税 回归 ,得 到 的 OLS 回归 线 也 在 该 图 中 描绘 出 来 ,所 估计 的 回归 
线 是 : 


— 
FatalityRate = 2.01 + 0.15 BeerTax (1982 年 数据 ) (8.2) 
(0.18) (0.135 


局 的 时 间 里 具有 台 比 性 : 剑 用 洒洒 在 从 覆 提 站 CPI) 将 它们 转化 为 1988 年 美元 。 二 如 ,由 于 通 
于 以 1988 年 美元 计价 的 1. 23 美元 的 税收 。 


解 ,比较 高 的 实际 啤酒 税 与 比较 多 而 不 是 比较 少 的 交通 事故 死亡 率 有 联系 。 

我 们 是 省 应 该 得 出 这 样 的 结论 :增加 啤酒 税 会 导致 更 多 的 交通 死亡 事故 ? 不 一 定 ,因为 
这 些 回归 可 能 含有 很 大 的 遗漏 变 芋 偏差 。 许 多 因素 影响 死亡 率 , 包 括 在 每 个 州 所 驾驶 的 汽 
车 质量 , 州 高 速 公路 是 否 处 于 良好 的 维护 状态 ,大 多 数 驾 车 是 在 城 里 还 是 在 农村 ,公路 上 汽 
车 的 密度 ,醉酒 驾车 在 社会 上 是 否 是 可 接受 的 。 这 些 因素 中 的 任何 一 个 因素 都 可 能 与 酒 税 
相关 ,如 果真 是 如 此 ,那么 它们 就 会 学 致 址 漏 变量 偏差。 处 理 这 些 遗 漏 变量 偏差 潜在 来 源 的 
一 种 方法 ,就 是 搜集 所 有 这 些 变 基 的 数据 ,并 将 它们 增加 到 公式 (8.2) 和 公式 (8.3) 的 年 度 
截面 回归 中 。 不 幸 的 是 ,有 些 变量 ,如 醉酒 驾车 的 文化 接受 度 ,可 能 很 难 测量 ,甚至 不 可 能 
测量 。 

然而 ,如 果 在 一 个 给 定 的 州 中 ,这 些 因素 不 随时 间 的 变化 而 变化 ,那么 可 走 男 一 个 途径 。 
由 于 我 们 有 面板 数据 ,因此 即使 我 们 不 能 够 测量 它们 ,我 们 也 能 使 这 些 因素 保持 不 变 。 为 了 
这 样 做 ,我 们 使 用 固定 效应 的 OLS 回归 。 


8.2 两 期 面板 数据 ;之 前 和 之 后 "的 比较 


当 获 得 每 个 州 了 =2 个 时 期 的 数据 时 ,我 们 就 可 以 把 第 二 个 时 期 的 因 变 量 值 与 第 一 个 时 
期 的 因 变量 值 进行 比较 。 通 过 集中 观测 因 变 量 的 蛮 化 ,这 种 “之 前 和 之 后 "的 比较 实际 上 使 
那些 难以 观测 的 因素 保持 不 变 , 那 些 难以 观测 的 因素 在 各 州 之 提 是 不 同 的 ,但 在 州 内 却 不 会 
随时 间 发 生变 化 。 

假设 Z 是 决定 第 i 个 州 交通 事故 死亡 率 的 变量 , 它 不 随时 间 变 化 而 变化 ( 因此 省 略 下 
AEDO. iin, Z, 可 能 是 对 醉酒 驾车 的 地 方 文化 态度 , 它 变化 缓慢 ,进而 可 以 认为 它 在 1982 
年 到 1988 年 之 间 是 保持 不 变 的 。 因 此 ,将 2 同 实际 啤酒 税 和 交通 事故 死亡 率 联系 起 来 的 
总 体 线 性 回归 是 : 





FatatiyRate , = B, + Bi BeerTax, + By2, + u, (8.4) 
其 中 ,4, 是 误差 项 ,i =1,…,n, ti=] T, 

BT Z, 不 随时 间 变化 而 变化 ,因此 ,在 公式 (8.4) 的 回归 模型 中 , 它 不 会 引起 1982 年 到 
1988 年 之 间 交 通 事故 死亡 率 的 任何 变化 。 因 此 在 这 个 回归 模型 中 , 通过 分 析 这 两 个 时 期 之 
间 的 交通 事故 死亡 率 的 变化 可 以 除去 Z. 的 影响 。 为 了 在 数学 上 理解 这 一 点 ,对 1982 年 和 
1988 年 这 两 年 中 的 每 一 年 ,考虑 方程 (8. 4) 


FatalityRate og = B, +B, BeerTax,osg + ByZ, + ñaqa (8.5) 
FatalityRate as = B, + Bi BeerTax ows +B, Z, + ass (8.6) 

用 公式 (8.6) 减 去 公式 (8.5) , 便 可 除去 Z, 的 影响 
FataluyRate ag - FatalityRate, ys = B, ( BeerTax ygs — BeerTaxuys2) + (awa ~ ug ) (8.7) 


这 种 设 定 有 个 直观 的 解释 。 对 醉酒 驾车 的 文化 态度 影响 一 个 州 的 醉酒 驾车 严重 程度 , 进 面 
影响 一 个 州 的 交通 事故 死亡 率 。 然 而 ,如 果 在 1982 年 和 1988 年 之 间 它 们 没有 发 生变 化 , 屠 
么 它们 将 不 会 引起 这 个 州 的 事故 死亡 率 的 任何 变化 。 更 确切 地 说 ,交通 事故 死亡 率 随时 间 
所 发 生 的 任何 变化 一 定 有 其 他 的 原因 。 在 公式 (8.7) 中 ,这 些 其 他 的 原因 就 是 啤酒 税 的 变 
化 或 误差 项 的 变化 ( 它 反 映 了 决定 交通 事故 死亡 率 变 化 的 其 他 因素 的 变化 )。 

对 公式 (8.7) 中 变化 的 回归 设 定 ,除去 了 不 随时 间 发 生变 化 的 且 难 以 观测 的 变量 Z, 的 
影响 。 换 名 话说 ,分 析 了 和 天 的 变化 具有 控制 随时 间 保 持 不 变 的 变量 的 作用 ,这 样 就 除去 
了 这 个 遗漏 变量 偏差 的 来 源 。 





图 8 一 2 表示 了 我 们 的 数据 集中 ,48 个 州 在 1982 年 到 1988 年 之 间 交 通 事故 死亡 率 变化 
对 实际 啤酒 税 变化 的 散 点 图 。 图 8 一 2 中 的 点 表示 给 定 的 州 在 1982 年 到 1988 年 之 间 交 通 
事故 钞 亡 率 的 变化 和 实际 啤酒 税 的 变化 。 使 用 这 些 数据 所 估计 的 并 在 图 中 画 出 的 OLS Pl 
归 线 是 ; 





FatalityRate g — FataluyRate s= -0.072 - 1.04 (BeerTaxiys - BeerTas wy } (8.8) 
(0.065) ¿(0.365 


其 中 ,所 包含 的 截 中 项 考虑 到 了 在 实际 啤酒 税 没 有 发 尘 变 化 的 情况 下 ,交通 事故 死亡 率 平均 
变化 的 可 能 性 是 非 零 的 。 
死亡 率 的 变化 
《每 万 人 的 死 六 人 数 ) 
1.0 Fatal Rate ss—FataluyRatevso=-0.072- 1 04(BeerTax iss BeerTaxise) 


. 
0.5 "i 
. Ld 





0.0 


-06 -04 -0.2 00 02 04 0.6 
啤酒 税 的 变化 
(以 1988 生 价格 计 
算 的 每 籍 的 价格 ) 
注 : 这 是 48 个 州 在 1982 年 到 1988 年 之 间 交 通 事故 死亡 率 变化 和 实际 啤酒 秘 变化 的 散 点 图 。 在 交 
通 事 故 死亡 率 变 化 和 啤酒 税 变化 之 间 存 在 负 向 关系 。 
图 8 一 2 ”交通 事故 死亡 率 和 了 啤酒 税 的 变化 11982- 一 1988 E} 
与 截面 回归 结果 相 比 较 , 上 式 中 实际 啤酒 税 变化 的 估计 效应 是 负 的 ,正如 经 济 理论 所 巴 
测 的 那样 。 总 体 斜 率 系 数 为 零 的 假设 在 5% 的 显著 性 水 平 下 被 拒绝 。 根 据 这 个 估计 系数 ， 
每 箱 啤 酒 实际 税 增加 1 美元 会 使 每 10 000 人 中 交通 事故 死亡 率 减少 1.04 例 。 这 个 估计 效 
应 是 很 大 的 :在 这 些 数据 中 平均 死亡 率 大 约 是 2( 也 就 是 说 ,总 体 中 每 10 000 人 中 每 年 有 2 
例 死亡 事故 ) ,因此 ,这 个 合计 值 表 明 每 箱 啤酒 实际 税 只 增加 1 美元 就 能 使 交通 事故 死亡 率 
减少 -一半 。 
通过 研究 交通 事故 死亡 率 随 时 间 发 生 的 变化 ,公式 (8.8) 中 的 回归 控制 了 诸如 对 醉酒 
驾车 的 文化 态度 这 样 的 固定 因素 ,但 是 存在 许多 影响 交通 安全 的 因素 ,如 果 它 们 随时 间 发 生 
变化 ,并 且 与 实际 啤酒 税 相关 ,那么 忽略 它们 将 会 引起 遗漏 变量 偏差 。 在 8. 5 节 中 ,我 们 进 
行 了 更 细致 的 分 析 ,那个 分 析 控制 了 好 几 个 这 样 的 因素 ,所 以 目前 最 好 暂 不 给 出 任何 关于 实 
际 啤酒 税 对 交通 事故 死亡 率 影 响 的 实质 性 结论 。 
当 数 据 在 两 个 不 同年 份 里 被 观测 时 ,可 以 采用 这 种 “之 前 和 之 后 "的 回归 分 析 方 法 。 然 
而 ,我 们 的 数据 集 包括 了 7 个 不 同年 份 的 观测 值 ,而 丢弃 那些 潜在 有 用 的 额外 数据 似乎 是 很 
BRN. BE, T>2 时 ,这 种 “之 前 和 之 后 ”的 方法 不 能 被 直接 应 用 。 为 了 分 析 我 们 的 面 
板 数据 集中 的 所 有 观测 值 , 我 们 使 用 固定 效应 回归 方法 。 








-8. 3 ”固定 效应 回归 


固定 效应 回归 是 控制 而 板 数 据 中 遗漏 变量 的 一 种 方法 ,这 里 的 遗漏 变量 在 实体 ( 州 ) 之 
间 发 生变 化 但 不 随时 间 发 生变 化 。 不 像 8.2 节 中 的 “之 前 和 之 后 "比较 , 当 每 个 实体 有 两 个 
或 多 个 时 期 的 观测 值 时 ,可 以 使 用 固定 效应 回归 。 

固定 效应 回归 模型 有 个 不 同 的 截 距 , 每 个 截 噬 对 应 于 一 个 实体 。 这 些 截 距 能 被 表示 
为 一 组 二 元 变量 (或 指示 变量 ) 。 这 些 二 元 变量 吸收 了 那些 在 州 之 间 不 同 但 又 不 随时 间 变 
化 的 所 有 遗漏 变量 的 影响 。 


8.3.1 固定 效应 回归 模型 


考虑 将 公式 (8.4) 中 的 因 变 量 ( FatalityRate ) 和 观测 到 的 回归 因子 ( BeerTax) 分 别 表示 
为 各 和 蕊 的 回归 模型 : 





Y, =Ë, +B,X, +62, +u, (8.9) 
#h,Z, 是 那些 在 州 之 间 发 生变 化 但 又 不 随时 刘 变 化 而 变化 的 难以 观测 的 变量 (例如 ,2, £ 
示 对 醉酒 驾车 的 文化 态度 ) 。 我 们 想 在 保持 那些 难以 观测 的 州 的 特征 Z 不 变 的 情况 下 , 估 
计 工 对 了 的 影响 有 。 
H T Z, 在 州 之 间 发 生变 化 ,但 又 不 随时 间 变 化 而 变化 ,因此 公式 (8.9) 中 的 总 体 回归 模 
型 可 以 被 解释 为 含有 个 截 距 , 即 每 个 州 对 应 一 个 截 距 。 具 体 地 说 ,假定 x =p tp AR 
么 公式 (8.9) 变 为 : 





Y, BX, +G, + u, (8.10) 
公式 (8. 10) 就 是 固定 效应 回归 模型 (fixed effects regression model) ,其 中 将 a ,… ,a, 看 
做 为 待 估计 的 未 知 截 距 , 每 个 a 对 应 着 一 个 州 。a, 可 以 被 解释 为 来 自 公式 (8. 10) 中 考虑 第 
i 个 州 的 总 体 回归 线 因 州 而 异 的 截 距 ,这 个 总 体 回 归 线 就 是 x, + 忆 X。 总 体 回归 线 的 斜率 
系数 B, 对 所 有 的 州 来 说 都 是 一 样 的 ,但 总 体 回归 线 的 截 距 在 各 州 之 间 却 发 生变 化 。 因 此 ， 
截 距 变化 的 根源 是 变量 Z , 它 ( 2.) 在 各 州 之 间 发 生变 化 但 又 不 随时 间 而 变化 。 
国定 效应 回归 模型 中 因 州 而 异 的 截 距 项 ,也 可 以 利用 表示 单个 州 的 二 元 变量 来 表达 。 
6.3 节 考 虑 了 这 种 情形 ,在 那里 观测 值 属 于 两 个 组 中 的 一 组 , 且 对 两 个 组 而 言 ,总 体 回归线 
有 相同 的 斜率 ,但 有 不 同 的 截 距 ( 见 图 6 一 8(a) ) 。 那 个 总 体 回 归 线 在 数学 上 是 使 用 表示 两 
组 之 一 的 单个 二 元 变量 来 表达 的 ( 见 重要 概念 6.4 中 的 第 1 种 情况 )。 如 果 在 我 们 的 数据 
集中 只 有 了 两 个 州 ,那么 二 元 变量 回归 模型 在 这 里 将 会 适用 。 然 而 ,由 于 我 们 不 止 有 两 个 州 ， 
所 以 我 们 需要 增加 额外 的 二 元 变量 来 捕 扣 公式 (3. 10) 中 所 有 因 州 而 异 的 截 距 。 
为 了 使 用 二 元 变量 展开 固定 效应 回归 模型 ,假定 D, 是 个 二 元 变量 , 当 i=1 时 ,D1, = 
1; 否 则 ,D1, =0, RHM i=2 时 ,D2, =1; 否 则 ,D2, =0; 如 此 等 等 。 我 们 不 能 够 把 所 有 的 
个 二 元 变量 和 一 个 共同 的 截 距 项 都 包括 进来 ,因为 如 果 那 样 的 话 ,回归 因子 将 是 完全 多 重 共 
线 的 ( 见 练习 8.2) 。 因 此 ,我 们 任意 地 省 略 第 一 组 二 元 变量 D1,, 从 而 ,公式 (8.10) 中 的 固 
定 效应 回归 模型 能 被 等 价 地 写 为 ， 
Y, =B, +B,X, +D, +y, D3, + +y Dn, +u, (8.11) 
HP Bo Boy 是 待 估计 的 未 知 系数 。 为 了 导出 公式 (8. 11) 中 的 系数 和 公式 (8. 10) 
中 的 截 距 之 间 的 关系 ,比较 这 两 个 方程 所 对 应 的 每 个 州 的 总 体 回归 线 。 在 公式 (8.11) 中 ， 
第 一 个 州 的 总 体 回归 方程 是 PB +B. X. BA m =Bo。 对 第 二 个 州 和 其 余 各 州 而 言 ,总 体 回 





归 方程 是 遍 +B X, ty ,所 以 对 于 i 关 2, 有 a =B +y. 这 样 ,就 有 了 表达 固定 效应 回归 模型 
的 两 个 等 价 的 方法 , 即 公式 (8.10) 和 公式 (8. 11)。 be 10) 中, 它 是 根据 = 个 因 州 而 
蜡 的 截 距 来 表示 的 。 在 公式 (8. 11) 中 ,固定 效应 模型 有 一 个 共同 的 截 上 中 和 -1 个 二 元 回 
归 因 子 。 在 这 了 两 个 表达 式 中 ,XX 的 色素 系数 在 不 同 的 州 之 癌 是 相同 的 。 公式 (8.10) 中 因 州 
而 蜡 的 裤 距 和 公 忒 (8. 11) 中 的 二 无 回 归 因 子 基 有 相同 的 来 源 , 即 在 各 州 间 发 生变 化 但 又 不 
随时 间 变 化 的 难以 观测 的 变量 Z, 


重要 概念 8. 2 


国定 效应 回归 模型 
固定 效应 回归 模型 是 ; 
Y, SBX a +. +B ta, +u, (8.12) 
Rrih,i=1,2, n. t=1,2,…,7, 多 ,是 实体 i 在 时 期 :的 第 一 个 回归 因子 值 ,X, ,是 第 二 个 
回归 因 子 值 ,如 此 等 等 ,而 % ,… ,a 是 特定 实体 的 截 距 。 
同样 ,国定 效应 回归 模型 也 可 以 写成 一 个 共同 的 截 距 .Xx 变量 以 及 除了 一 个 实体 以 外 的 
代表 其 余 实 体 的 所 有 ~1 个 二 元 变量 : 
F, =P A + +B,X, , +y,D2 +y D3, + ty Dn, +u, (8. 13) 
其 中 ,如 果 i=2, 那 么 D2 =Y; SMB. D2 =0, 依 时 类 推 。 
推广 到 多 元 杰 晨 X。 如 果 存 在 决定 了 变化 的 其 他 可 观测 的 因素 ,而 且 如 果 这 些 因 素 与 
变 基 工 相 关 并 随时 间 变 化 而 变化 ,那么 这 些 决 定性 因素 也 应 该 被 包括 在 回归 中 以 避免 发 生 
遗漏 变量 偏差 , 由 此 便 产 生 了 具有 多 个 回归 因子 的 固定 效应 模型 ,被 总 结 在 重要 概念 
8.2 中 。 
贱 定 效应 回归 模型 的 最 小 二 乘 假设 。 对 固定 效应 回归 模型 而 言 , 存 在 五 个 最 小 二 乘 假 
设 :在 重要 概念 5.4 中 多 元 回归 模型 的 四 个 假设 (对 面板 数据 进行 了 修正 ) 吉 .上 第 五 个 新 的 
假设 。 在 截 而 数据 中 ,误差 项 在 实体 之 间 是 不 相关 的 ,以 回归 因子 为 条 件 。 把 这 个 假设 推广 
到 而 松 数据 中 , 便 得 到 了 第 五 个 假设 ,这 个 假设 假定 ,误差 项 不 仅 在 实体 之 间 不 相关 ,在 不 同 
时 期 也 不 相关 ,也 以 回归 因子 为 条 件 。 这 些 假设 在 概念 上 类 似 于 多 元 回归 模型 的 最 小 二 乘 
假设 ,但 是 由 于 和 面板 数据 集 有 关 的 符号 十 分 复杂 ,因此 它们 的 数学 表达 也 相当 复杂 。 附 录 
8.2 中 叙述 并 讨论 了 这 些 假设 。 


8.3.2 估计 和 推断 


从 原则 上 说 ,固定 效应 回归 模型 {公式 (8.13) ) 的 二 元 变量 设 定 也 可 以 使 用 0LS 来 佑 
计 。 然 面 ,这 个 回归 有 +n 个 回归 因子 ( 米 个,n -1 个 二 元 变量 和 一 个 截 距 ) ,因此 ,如 果 
实体 数 很 大 ,那么 在 实际 中 ,这 个 OLS 回归 是 元 长 的 ,在 一 些 软 件 包 里 甚至 不 可 能 运行 。 因 
此 ,经 济 计量 软件 中 一 般 含 有 固定 效应 回归 模型 的 0LS 估计 的 特定 程序 。 这 些 特定 的 程序 
等 价 于 对 全 部 二 元 变量 回归 使 用 0LS ,但 是 由 于 程序 运用 了 固定 效应 回归 在 代数 土 所 出 现 
的 一 些 数学 简化 ,因此 程序 运行 比较 快 。 

“去 均值 实体 (entity-demeaned) "的 OLS 算法 。 回 归 软 件 用 两 个 步 又 来 计算 OLS 固定 
效应 的 估计 量 。 在 第 一 步 中 ,每 个 变量 减 去 每 个 对 应 实体 的 均值 。 在 第 二 步 中 ,使 用 “去 均 
值 实体 "变量 来 估计 回归 。 具 体 来 说 ,考虑 公式 (8. 10) 中 固定 效应 模型 中 单个 回归 因子 的 
情形 ,并 对 公式 (8. 10) 两 边 ( 关 于 时 间 站 取 平 均值 ,那么 就 有 了 =g X. + a, +, JE: Y, = 








8.4 带 有 时 间 国 定 效应 的 回归 - 


就 像 每 个 实体 的 固定 效应 能 够 控制 那些 不 随时 间 变 化 而 变化 但 在 各 实体 间 却 不 相同 的 
变量 一 样 ,时 间 固 定 效 应 也 能 够 控制 在 实体 间 不 变 但 随时 间 变 化 的 变量 。 

让 于 新 车 安全 设施 的 改善 在 全 国 范围 内 采用 ,因此 它们 有 助 于 减少 所 有 和 州 的 交通 死亡 
事故 。 因 而 ,将 汽车 安全 作为 一 个 随时 间 变 化 但 对 所 有 的 州 有 相同 值 的 遗漏 变量 似乎 是 合 
理 的 。 我 们 用 S, 表示 汽车 安全 ,公式 (8.9) 中 的 总 体 回归 可 被 修改 为 包括 汽车 安全 效应 的 
方程， 

Y, =ñ, +B,X, +R, +B,S, + u, (8.16) 
其 中 ,S, 是 难以 观测 的 ,这 里 单个 下 角 标 i" 强调 安全 性 随时 间 发 生变 化 但 在 各 州 间 不 变 。 
H B,S, 代表 了 决定 了 ,的 变量 ,因此 如 果 S, 与 芭 , 相 关 , 那 么 回归 中 忽 格 S. 将 会 导致 遗漏 
变量 偏差 。 


8.4.1 只 有 时 间 效 应 


目前 ,假设 变量 Z 不 存在 ,所 以 BZ, 项 可 以 从 公式 (8.16) 中 省 略 掉 ,尽管 记 5, 项 留 下 
来 了 。 我 们 的 目标 是 控制 9 ,合计 。 

虽然 S, 是 难以 观测 的 ,但 是 由 于 它 随时 间 发 生变 化 但 在 州 之 间 不 发 生变 化 ,因此 ,就 像 
除去 在 州 之 间 发 生变 化 但 不 随时 间 变 化 的 Z 的 影响 -- 样 ,除去 它 的 影响 也 是 可 能 的 。 也 就 
是 说 ,可 以 用 一 组 了 个 二 元 变量 代替 8,3, ,每 个 二 元 变量 表示 一 个 不 同 的 年 份 。 具 体 来 说 ， 
假设 如 果 : 是 样本 中 的 第 一 个 时 期 ,那么 B1, =1; 否 则 ,B1, =0。 假 设 如 果 + 是 样本 中 的 第 二 
个 时 期 ,82, =1; 否 则 ,B82, =0, 依 此 类 推 。 这 些 二 元 变量 Bl... BT, 被 称 为 时 间 效 应 {time 
effects). 

含有 单个 半 回 归 因 子 和 了 -1 个 时 间 效 应 的 时 间 效 应 回归 模型 {time effects 


regression model) 为; 





Y, =Á, *B,X, +8,B2, + +8,BT, +u, (8.17) 
HP 8i 是 未 知 系数 。 同 公式 {8. LI) 中 的 固定 效应 回归 模型 一 样 ,这 个 时 间 效 应 模 
型 中 也 包含 了 截 距 , 而 且 为 了 防止 完全 多 重 共 线 性 ,第 一 个 二 元 变量 ( REKT. 
在 交通 事故 死亡 率 一 例 的 回归 中 ,公式 (8.17) 中 的 时 间 固 定 效 应 设 定 允许 我 们 消 踪 像 
在 全 国 范围 内 引进 汽车 安全 标准 这 样 的 遗漏 变量 所 引起 的 偏差 ,在 给 定 的 年 份 里 ,汽车 安全 
标准 随时 间 发 生变 化 但 在 各 州 间 不 变 。 


8.4.2 时 间 和 州 固定 效应 


如 果 一 些 遗 漏 变量 不 随时 间 变 化 而 变化 但 在 州 间 却 发 生变 化 (如 文化 规范 ) ,而 其 他 一 
些 和 遗 漏 变量 在 州 之 间 不 变化 但 随时 间 变 化 而 变化 (如 全 国 性 的 安全 标准 ) ,那么 把 州 效应 和 
时 间 效 应 都 包括 进来 是 合适 的 ,通过 在 回归 中 把 = -1 个 州 的 二 元 变量 和 了 -1 个 时 间 二 元 
变量 以 及 一 个 截 距 项 包括 进来 ,就 可 以 做 到 这 一 点 。 合 并 的 时 间 和 实体 固定 效应 回归 模型 
(time and entity fixed effects regression model) 为 ; 
Y. =B, +B,X, +y,D2 +. +y Dn, +0,B2 + +6BT, +u, (8.18) 
EP „BoB y. y. 5, 6; 都 是 未 知 系数 。 
这 个 合并 的 时 间 和 州 固定 效应 回归 模型 ,消除 了 那些 不 随时 间 发 生变 化 的 难以 观测 的 





变量 和 那些 在 州 之 间 不 发 生变 化 的 难以 观测 的 变量 所 引起 的 遗漏 变量 偏差 。 

当 存 在 其 他 的 可 观测 的 回归 因子 "4 时 ,这 些 回归 因子 也 应 该 出 现在 公式 (8. 18) 中 。 

佑 中 。 时 间 闫 定 效 应 模型 和 时 间 与 实体 { 州 }? 固 定 效应 模型 都 是 多 元 回忆 模型 的 变 体 。 
这 样 ,它们 的 系数 可 以 通过 包括 额外 的 时 间 二 元 变量 用 01S 来 估计 。 一 些 软件 并 入 了 计算 
合并 的 时 间 轩 定 交 应 与 实体 固定 效应 回归 的 算法 。 这 个 算法 在 计算 上 比 会 式 (8. 18) 中 完 
全 的 二 元 变量 模型 的 OLS 估计 更 有 效 。 

在 交通 死亡 例子 中 的 应 用 。 将 时 间 效 应 增加 到 州 固定 效应 回 妇 中 就 生 或 了 回归 线 的 
OLS 估计 : 





— a 
FataltyRate = i 64 BeerTax + State PuyedE:fects + Time Fixed Effects (8.19) 
0.25 


这 种 模型 设 定 包括 啤酒 税 .47 个 州 的 二 元 变量 ( 州 固定 效应 ) .6 +E fi — u 3k ( hH) lš] 
和 定 效应 ) 和 一 个 截 距 ,因此 实际 上 这 个 回归 右边 有 1 +47 +6+1=55 个 变量 ! 由 子 时 间 和 州 
二 元 变量 系数 与 鹤 距 不 是 我 们 主要 感 兴趣 的 对 象 ,因此 这 里 没有 给 出 。 

把 时 间 效 应 包括 进来 对 实际 啤酒 税种 交通 事故 死亡 率 之 间 的 估计 关系 几乎 没有 影响 
(比较 公式 (8, 15) 和 公式 (8 19))。 实 际 啤 酒 税 系数 在 5 多 的 水 平 下 仍旧 是 显著 的 (1 = 
-0.64/0.25 = -2 56)。 

在 实际 啤酒 税 和 交通 事故 死亡 率 之 则 的 这 个 估计 关系 ,不 受 来 自 于 不 随时 间或 州 的 变 
化 而 变化 的 变量 的 遗 汗 变 基 偏 差 的 影响 。 然 而 ,影响 交通 死亡 事 放 的 许多 重要 的 决定 性 因 
素 并 没有 被 包含 在 这 个 类 别 里 ,因此 ,这 种 设 定 仍旧 爱 直 尘 变 量 偏差 的 影响 。 有 了 固定 效应 
回归 的 工具 ,我 们 可 对 手中 这 些 数 据 进 行 更 全 面 的 实证 分 析 。 


[83.5 _ 醉酒 驾车 法 与 交通 事故 死亡 率 ] 


酒 税 只 是 规劝 醉酒 驾车 的 一 种 方法 。 每 个 州 对 醉酒 驾车 的 惩罚 不 同 ,而且 制 裁 醉酒 鸭 
车 的 州 除了 提高 税收 以 外 ,还 可 以 通过 加 强 立 法 来 实现 对 醉酒 四 车 的 全 面 制裁 。 如 果 是 这 
样 的 话 ,忽略 这 些 法 律 制度 会 在 实际 啦 酒 税 对 交通 事故 死亡 率 影响 的 OLS 估计 量 中 ,甚至 
在 合 有 州 和 时 间 固 定 效 应 的 回归 中 ,产生 遗漏 变 量 偏 差 。 此 外 ,由 于 车 辆 使 用 部 分 依赖 于 司 
机 是 否 有 工作 ,而 且 由 于 税收 的 变化 能 够 反映 经 济 条 件 ( 州 预算 赤字 会 导致 税收 上 升 ) , 因 
此 忽略 州 经 济 条 件 也 会 导致 壹 小 变 量 偏差 。 

本 节 中 ,在 经 济 条 件 保 持 不 变 的 情况 下 ,我 们 将 前 面 的 分 析 推 广 到 研究 饮酒 法 (包括 啤 
酒 税 ) 对 交通 事故 死 广 率 的 影响 。 通 过 把 代表 其 他 醉酒 驾车 法 和 州 经 济 条 件 的 回归 因子 包 
括 在 面板 数据 回归 中 来 进行 估计 ,我 们 就 可 以 实现 这 个 目标 。 

计算 结果 归纳 在 表 8 一 ! 中 。 表 8 一 ! 的 格式 和 第 5 第 6,. 第 ?7 章 中 的 回归 结果 表 的 格 
式 相同 ;每 列 报告 不 同 的 回归 结果 ,而 每 行 则 报告 系数 估计 值 ,标准 误 ,F 统计 量 、p 值 或 者 
有 关 回 归 的 其 他 信息 。 

表 8 一 ! 中 第 (1) 列 给 出 了 在 没有 州 和 时 间 固 定 效应 的 情况 下 ,交通 事故 死亡 率 对 实际 
啤酒 税 的 OLS 回归 的 结果 。 园 1982 年 和 1988 年 的 截面 回归 (公式 (8.2) 和 公式 (8.3) ) 一 
Fe ,实际 啤酒 税 的 系数 是 正 的 (0. 36) ,而 且 第 (1) 列 的 佑 计 值 在 5 名 的 水 平 下 在 统计 上 显著 
地 异 于 0。 根 据 这 个 估计 值 ,提高 啤酒 税 会 增加 交通 事故 省 亡 率 ! 然而 ,包括 州 固定 效应 的 
第 (2) 列 中 的 回归 (和 前 面 公式 (8. 15) 所 给 出 的 一 样 ) 表 明 ,回归 (1) 中 正 的 系数 是 由 址 活 
变量 偏差 造成 的 (实际 啤酒 税 系数 是 -0. 66) 。 当 包括 国定 效应 时 ,回归 的 站 从 0.090 BE 








0. 889 ,很 显然 , 州 固定 效应 解释 了 数据 变 差 的 大 部 分 变化 。 





















































表 8 一 ! 醉酒 驾车 法 对 交通 死亡 影响 的 回归 分 析 
因 变 量 :交通 事故 死亡 率 | 每 10 000 人 口 的 死亡 人 数 ) 
回归 因子 (1) (2) (3) (4) (5) {6) 
Rugi B: 0.36'” -066 -0.64% -045° —-070'° -0.46° 
(0.05) (0.20) (0.25) (0.22) (0.25) (0.22) 
TIKI 3853 18 0.028 -0.011 
(0.066) (0.064) 
饮酒 年 龄 为 19 -0.019 -0.078 
(0.040) (0.049) 
饮酒 年 龄 为 20 0.031 -0.102° 
(0.046) (0.046) 
KAER -0. 002 
(0.017) 
强制 性 坐牢 0.013 -0.026 
(0.032) (0.065) 
强制 性 社区 服务 0.033 0.147 
(0.115) (0.137) 
强制 性 坐牢 或 强制 性 社区 服务 0.031 
(0.076) 
每 位 驾驶 员 的 平均 车 辆 里 程 0.008 0017 0.009 
(0.008) (0.010) (0.008) 
RR - 0. 063 ° ° - 0.063 ° ° 
{0.012} (0.012) 
人 均 实际 收入 (对 数 ) 1.81** 1.7977 
(0.47) (0.45) 
州 效 应 否 是 是 是 是 是 
时 间 效 应 否 否 是 是 是 是 
检验 排除 变量 组 的 三 统计 量 和 P 值 
时 间 效 应 =0 2.47 11.44 2.28 11.59 
(0.024) ( <0.001) (0.037) ( <0.001) 
局 泗 年 龄 系数 = 0 0. 48 2.09 
(0.696) (0. 102} 
坐牢 .社区 服务 系数 =0 0. 17 0. 59 
(0.845) (0.557) 
RER .人均 收 人 系数 =0 38. 29 40. 2 
( <0.001) ( <0.001) 
F” 0. 090 0. 889 0.891 096 0893 0.926 





注 :这 些 回 归 是 使 用 附录 8. 1 中 所 介绍 的 美国 48 个 州 从 1982 年 到 1988 年 (总 共 336 个 观测 值 ) 的 面 
板 数据 来 估计 的 。 标 准 误 在 系数 下 面 的 括号 中 给 出 ,P 值 在 正统 计量 下 面 的 括号 中 给 出 。 个 别 系 数 在 
“5 锅 的 显著 性 水 平 下 或 ”1 色 的 显著 性 水 平 下 在 统计 上 是 显著 的 。 








归 , 研 究 了 该 分 析 结果 对 使 用 饮酒 年 龄 (用 饮酒 年 龄 本 身 代 替 三 个 指示 变量 ) 的 不 同 函 数 形 
式 以 太 对 合并 山 个 二 元 惩罚 变量 的 敏感 性 。 回 归 (4) 中 的 结果 对 这 些 变 化 是 不 敏感 的 。 

这 种 分 析 的 优势 是 ,把 州 和 时 间 画 定 效 应 包括 进来 ,缓和 了 那些 不 随时 间 发 生变 化 ( 像 
对 醉酒 区 车 的 文化 态度 ) 或 者 在 州 间 不 发 生变 化 ( 像 车 辆 的 安全 革新 措施 ) 的 难以 观测 的 变 
量 所 引起 的 遗漏 变量 偏差 的 威胁 。 然 而 像 通 常 一 样 ,认识 到 这 种 分 析 可 能 的 局 限 手 也 是 非 
常 重要 的 。 遗 漏 变量 偶 差 的 一 个 潜在 的 来 源 是 ,这 里 所 使 用 的 酒 税 的 测度 , 即 实际 哮 酒 税 ， 
可 能 会 和 其 他 酒 税 一 起 变化 ,这 表册 我 们 在 解释 结果 时 不 能 单单 局 限于 啤酒 税 。 一 个 比较 
细微 的 可 能 性 是 实际 啤酒 税 的 增加 可 能 与 公共 教育 运动 有 关 , 这 也 许 是 对 政治 压力 的 反应 。 
如 果 是 这 样 的 话 ,实际 啤酒 税 的 变化 可 以 因为 这 一 广泛 的 运动 而 扩大 对 醉酒 驾车 的 效应 。 

这 些 结 果 为 控制 醉酒 驾车 和 交通 事故 死亡 率 提供 了 一 个 富有 挑战 性 的 测度 建议 。 根 据 
这 些 估计 值 ,严厉 的 惩罚 和 提高 最 低 人 台 法 饮酒 年 龄 对 交通 事 改 死亡 率 都 设 有 重要 影响 。 相 
反 , 有 证 据 表 明 增 加 酒 税 , 就 像 用 实际 啤酒 税 所 合计 的 那样 ,确实 三 少 了 交通 死亡 人 数 。 然 
而 ,这 个 效应 的 大 小 估计 得 还 不 够 精确 。 


[8.6_ 结论 - 


本 章 说 明了 如 何 使 用 相册 实体 随时 间 变 化 的 多 个 观测 值 来 控制 实体 回 不 同仁 又 不 随时 
间 变 化 的 难以 观测 的 遗漏 变 量 。 关 键 的 要 点 是 ,如 果 难 以 观测 的 变量 不 随时 间 发 生变 化 , 那 
么 因 变 量 的 企 何 变化 一 定 是 由 于 除 这 些 固 定 特 征 以 外 的 其 他 因素 的 影响 。 如 果 对 醉酒 驾车 
的 文化 态度 在 一 个 州 内 7 年 间 不 发 生 明显 变化 ,那么 在 这 ?7 年 间 对 交通 事故 死亡 率 变 化 的 
解释 一 定 依赖 于 别 的 因素 。 

为 了 拓展 这 个 观点 ,你 需要 同一 个 实体 在 两 期 或 者 两 期 以 上 的 时 间 内 所 观测 到 的 数据 ， 
也 就 是 说 ,你 需要 面板 数据 。 有 了 面板 数据 ,第 2 部 分 的 多 元 回归 模型 可 以 被 推广 到 包括 二 
元 变量 的 全 集 ,每 个 二 元 变量 对 应 着 一 个 实体 ,这 就 是 固定 效应 回归 模型 , 它 能 够 用 OLS 进 
行 估计 。 处 理 国定 浆 应 回 妇 模型 的 方法 就 包括 时 间 轿 定 效应 , 它 控制 了 随时 间 变 化 但 在 实 
体 间 不 变 的 难以 观测 的 变 基 。 实 体 和 时 间 固 定 效应 都 可 以 恰 包 含 在 回归 中 , 以 控制 那些 在 
实体 间 变 化 但 不 随时 间 变 化 的 变量 和 那些 随时 间 变 化 但 在 实体 间 不 发 生变 化 的 变量 。 

虽然 有 这 些 优 点 ,但 是 实体 和 时 间 固 定 效应 回归 却 不 能 控制 在 实体 问 变化 且 随 时 间 变 
化 的 遗漏 变量 。 很 显然 ,面板 数据 方法 需要 面板 数据 ,但 面板 数据 通常 是 得 不 到 的 。 这 样 ， 
当面 板 数据 方法 完成 不 了 任务 时 ,还 需要 另 一 种 能 够 消除 那些 难以 观测 的 遗 潮 变 量 影 响 的 
方法 。 完 成 这 项 任务 的 一 个 有 力 而 又 一 般 的 方法 就 是 工具 变量 回 妇 ,这 是 第 10 章 的 主题 。 


[总 结 - 


1. 面板 数据 是 由 多 个 (n) 实 体 一 一 州 , 企 业 , 人 等 一 一 的 观测 值 构 成 的 ,其 中 每 个 实体 
都 被 观测 两 期 或 两 期 以 上 (7) 。 

2. 带 有 实体 固定 效应 的 回归 ,用 来 控制 那些 在 实体 间 不 出 但 又 不 随时 间 发 生变 化 的 难 
以 观测 的 变量 。 

3. 当 有 两 个 时 期 时 ,固定 效应 国 归 可 以 用 因 夺 的 变化 而 发 生 的 了 从 第 一 期 到 第 二 期 变 














化 的 "之 前 和 之 后 "回归 进行 估计 。 

4. 实体 固定 效应 回归 ,可 以 采用 在 方程 中 包含 #1 个 实体 的 二 元 变量 .可 观测 的 自 变 
量 (X) 和 一 个 截 距 项 的 方法 进行 估计 。 

5， 时 间 固 定 效应 控制 了 那些 在 实体 间 相 同 但 随时 间 发 生变 化 的 难以 观测 的 变量 。 

6. 包含 时 间 和 实体 固定 效应 的 回归 ,可 以 采用 在 方程 中 包含 R -1 个 实体 的 二 元 变量 
和 了 -上 个 时 期 的 二 元 变量 ,加 上 自 变 量 X 和 一 个 截 距 项 的 方法 进行 估计 。 


[重要 术语 


面板 数据 ”均衡 面板 ” 非 均 衡 面板 ”固定 效应 回归 模型 ”时 间 固 定 效应 ”时 间 效 应 回 
归 模 型 ”时 间 和 实体 固定 效应 回归 模型 


[复习 概念 - 


8.1 为 什么 必须 使 用 两 个 下 角 标 i 和 上 来 描述 面板 数据 ? i 指 的 是 什么 ? í 又 指 的 是 
什么 ? 

8.2 一 位 研究 人 员 正 使 用 一 个 面板 数据 集 ,其 中 含有 n=1 000 名 工人 、T=10 年 (从 
1991 年 到 2000 年 ) 的 面板 数据 ,变量 包括 工人 收入 性别, 教育 和 年 龄 。 该 研究 人 员 拟 研究 
教育 对 收入 的 影响 ,请 给 出 一 些 与 教育 和 收入 变化 相关 的 且 难 以 观测 的 因 人 而 异 的 变量 的 
例子 。 你 能 想象 出 那些 可 能 与 教育 和 收入 都 相关 的 因 时 间 变 化 而 变化 的 变量 的 例子 吗 ? 在 
面板 数据 回归 中 ,你 如 何 控制 这 些 因 人 而 异 和 因 时 间 而 异 的 效应 呢 ? 

8.3 你 在 回答 问题 8. 2 时 所 提出 的 回归 ,能 否 被 用 于 估计 性 别 对 个 人 收入 的 影响 ? 该 
回归 能 和 否 被 用 于 估计 全 国 失业 率 对 个 人 收入 的 影响 ? 请 解释 原因 。 


r 练 >J- 
— 


8 1 这 个 问题 涉及 表 S — HAARR g: EE B|), 

“a 新 泽 西 州 的 人 口 是 8 100 000。 假 设 新 泽 西 州 每 箱 啤 酒 增 加 1 美元 税收 (以 1988 年 
美元 计算 ) ,使 用 第 (4) 列 中 的 结果 预测 下 一 年 将 被 挽救 的 生命 数 。 为 你 的 答案 构造 一 个 
95 久 的 置信 区 间 。 

b. 新 泽 西 州 的 饮酒 年 龄 是 21 岁 。 假 设 新 泽 西 州 将 其 饮酒 年 龄 降低 到 18 岁 , 使 用 第 
(4) 列 中 的 结果 预测 下 一 年 中 交通 事故 死亡 率 的 变化 。 为 你 的 答案 构造 一 个 %5 旬 的 置信 
区 间 。 

"o 假设 新 泽 西 州 下 一 年 的 实际 人 均 收 人 增加 1% ,使 用 第 (4) 列 中 的 结果 预测 下 一 年 
中 交通 事故 死亡 率 的 变化 。 为 你 的 答案 构造 一 个 中 5 免 的 置信 区 间 。 

d. 该 回归 是 否 应 该 包括 时 间 效 应 ”为 什么 ? 

"e. 第 (5) 列 中 啤酒 税 系数 的 估计 值 在 1% 的 水 平 下 是 显著 的 ,第 (4) 列 中 的 估计 值 在 
5% 的 水 平 下 是 显著 的 ,这 是 否 意味 着 第 (5) 列 中 的 估计 值 更 可 靠 ? 

f 一 位 研究 人 员 推测 ,失业 率 对 西部 地 区 州 的 交通 事故 死亡 率 的 影响 不 同 于 其 他 州 。 
你 怎样 检验 这 个 假设 ? (提示 :要 明确 你 所 使 用 的 回归 设 定 种 统计 检验 ) 

8.2 ” 考 弄 方程 (8. 11) 中 的 固定 效应 模型 的 二 元 变量 形式 ,这 里 只 是 多加 了 一 个 额外 








回归 因子 DL , BHEE: 
Y, =Ë +B X, +y, Dl, + yD2, + + y, Da, + ü, (8. 20) 

a. 假设 n=3, 证 明 ; 二 元 变量 回归 因子 和 “常数 "回归 因子 是 完全 和 多重 共 线 的 ,也 就 是 
说 ,将 D1,,D2,,D3, 和 总 中 任何 一 个 变量 表示 成 其 他 变量 的 完全 线性 函数 ,其 中 ,对 于 所 
有 的 ;和 :都 有 zi . = 1, 

b. 对 于 一 般 的 ,证 明 {a) 中 的 结论 。 

e. 如 果 你 尝试 用 OL 估计 公式 (8. 20) 中 的 回归 系数 ,那么 将 会 发 生 什 么 ? 

8.3 7.3 节 中 列 出 了 对 回归 研究 中 的 内 部 有 效 性 的 五 个 潜在 威胁 。 将 这 些 威胁 因素 
应 用 于 8.5 节 中 的 经 验 分 析 , 从 而 得 出 关于 它 的 内 部 有 效 性 的 结论 。 


[附录 8.1 _ 州 交通 事故 死亡 率 数据 集 ; 


该 数据 是 美国 "下 48 个 州 "《 除 了 阿拉 斯 加 和 夏威夷 ) 从 1982 年 到 1988 年 的 年 度数 
据 。 交 通 事故 死亡 率 是 指 ,在 给 定 的 年 份 里 生活 在 给 定 的 州 内 的 每 10 000 人 中 交通 事故 的 
死亡 人 数 。 交 通 事 放 死 亡 率 数 据 是 从 美国 交通 部 重大 事故 报告 系统 中 获得 的 。 啤 酒 税 是 每 
箱 啤 酒 的 税收 , 它 是 对 一 个 州 中 酒 税 的 一 般 性 测度 。 表 8 一 1 中 的 饮酒 年 龄 变量 是 表示 合法 
饮酒 年 龄 是 否 为 18 岁 .19 岁 或 20 岁 的 二 元 变量 。 表 8 一 1 中 的 两 个 二 元 惩罚 变量 描述 了 
该 州 对 醉酒 驾车 初 犯 定罪 的 最 低 审 判 要 求 ; 如 果 按 该 州 的 标准 要 求 坐 牢 , 那 么 “强制 性 坐 
牢 " 等 于 1 否则 ,等 于 0。 如 果 该 州 要 求 做 社区 服务 ,那么 “强制 性 社区 服务 "等 于 1; 否则 ， 
等 于 0。 州 的 年 度 车 辆 行驶 总 里 程 数 据 从 美国 交通 部 得 到 ,个 人 收入 数据 从 美国 经 济 分 析 
局 获得 ,而 失业 率 数 据 则 从 美国 劳动 统计 署 获 得 。 

很 感谢 北 卡 多 莱 纳 大 学 经 济 系 Christopher J. Ruhm 教授 向 我 们 提供 了 这 些 数 据 。 





[附录 8.2_ 国定 效应 同 归 的 假设 ; 


重要 概念 8. 2 中 列 出 了 固定 效应 回归 模型 的 五 个 最 小 二 和 愤 提 设 。 就 单个 回归 因子 而 
言 ,这 五 个 假设 是 : 

1.E(u lX ,Xa Xara) =0; 

2. (CFFas Kr Yas Yas Yr) ,i=1,2,.. 尺 ; 取 自 于 它们 联合 分 布 的 独立 同 分 布 的 
样本 ; 
3. (XX,,u4) 有 非 零 的 有 有限 的 四 阶 矩 ; 

4. 不 存在 完全 多 重 共 线性 ; 

5， 对 于 t8, 有 cov( u X. .X. a ) =Ü, 

对 多 个 回归 因子 而 言 ,应 该 用 全 列 X... X, e X, AUB X, 

第 一 个 假设 是 指 ,在 给 定 回 归 因 子 的 条 件 下 ,误差 项 的 条 件 均值 为 零 。 这 与 重要 概念 
5.4 中 的 第 一 个 最 小 二 乘 假设 相同 ,被 推广 到 包括 二 元 回归 因子 和 第 ; 个 实体 随时 间 变 化 的 
关于 了 的 所 有 了 个 观测 值 ,在 第 2 部 分 中 这 个 假设 的 讨论 可 以 被 直接 推广 。 

第 二 个 假设 将 多 元 回归 的 独立 同 分 布 假设 推广 到 面板 数据 。 如 果实 体 是 从 总 体 中 通过 
简单 随机 抽样 米 选 择 的 ,那么 这 个 假设 就 成 立 。 因 而 ,一 个 实体 的 变量 除了 与 另 一 个 实体 变 
量 同 分 布 外 ,还 独立 于 另 一 个 实体 变量 的 分 布 ,也 就 是 说 ,对 于 i = 1,2,…,n ,变量 是 独立 同 
分 布 的 。 记 今 为 止 ,这 种 推理 与 截面 数据 推理 一 样 。 然 而 ,在 面板 数据 中 ,实体 按照 时 间 排 
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除 种 族 不 同 外 ,两 个 条 件 完全 相同 的 人 走 进 一 家 银行 申请 一 笔 很 大 数额 的 抵押 货款 , 目 
的 是 每 人 况 买 一 套房 子 ,两 套房 于 的 条 人 忻 也 完全 相同 。 轨 行 是 否 会 以 同样 的 方式 对 待 他 们 ? 
他 们 是 否 有 同等 可 能 性 证 他 们 的 抵押 货款 申请 被 摄 受 ? 根据 法 律 ,他 们 必须 受到 同 车 对 待 ， 
但 是 他 们 是 否 能 确实 得 到 同等 对 待 是 银行 监管 者 很 关心 的 一 个 问题 

有 许多 合理 的 理由 批准 沉 款 和 拒绝 贷款 。 合 如 ,如 果 所 提出 的 沉 款 偿付 额 占用 了 中 请 
者 的 夫 部 分 或 者 全 部 的 月 站 入 ,那么 信贷 员 可 以 有 理由 地 拒绝 这 笔 上 沉 款 。 毕 竟 信 贷 员 也 是 
人 ,他 们 也 会 犯 普通 的 错误 ,所 以 对 一 个 少数 民族 申请 者 拒绝 的 例子 无 法 证 明 任 何 关 于 种 族 
践 视 问题 的 存在 。 因 而 ,许多 种 族 层 视 的 研究 寻找 关于 种 族 歧 视 的 统计 证 所 ,也 就 是 说 ,从 
大 量 的 数据 集中 寻找 能 够 证 明白 人 和 少数 民族 是 否 被 区 别 对 待 的 证 据 。 

但 是 在 扼 押 货款 市 场 上 ,人 们 该 如 何 精确 地 检查 种 族 战 视 的 统计 证 据 ? 一 个 出 发 点 就 
是 ,比较 少数 民族 申请 者 和 和 白人 申请 者 抵押 货款 被 拒绝 的 比重 。 在 本 章 所 研究 的 数据 中 , 搜 
集 了 1990 年 在 钙 萨 诸 塞 州 波士顿 地 区 的 抵押 货款 申请 ,资料 显示 有 28 驳 的 黑人 申请 者 被 
拒绝 ,但 仅 有 9 驹 的 向 人 申请 者 被 拒绝 。 但 是 ,这 个 比较 并 没有 真正 回答 本 章 开 藉 所 提出 的 
问题 ,因为 黑人 申请 者 和 白人 申请 者 不 一 定 “ 除 了 他 们 的 种 族 外 都 是 相同 的 "。 相 反 ,我 们 
需要 一 种 在 保 特 其 他 申请 者 特征 不 变 的 情况 下 比较 拒绝 牵 的 方法 。 

这 看 起 来 像 是 多 元 回归 分 析 的 事情 一 一 它 确 实 是 ,除了 在 方法 上 。 这 个 方法 就 是 因 变 
量 一 一 中 请 者 是 否 被 拒绝 一 一 是 二 元 变量 的 回归 方法 。 在 第 2 部 分 中 ,我 们 经 常 将 二 元 变 
本 用 做 回归 因子 ,它们 没有 引起 任何 特别 的 问题 。 但 是 当 因 变量 是 二 元 变量 时 ,事情 就 变 得 
困难 了 ;用 一 条 直线 去 氢 合 只 取 0 和 1 这 两 个 值 的 因 变 量 意味 着 什么 ? 

这 个 问题 的 答案 就 是 把 这 个 回归 浮 数 解释 为 一 个 被 预测 的 概率 。 在 9.1 节 中 我 们 讨论 
了 这 个 解 释 , 它 允许 我 们 将 第 2 部 分 中 的 多 元 加 归 模 型 应 用 于 二 元 因 亦 量 。9. 1 节 复 习 了 
这 个 “线性 枝 率 模型 " 。 但 是 ,对 这 小 被 预测 的 概率 的 解释 表明 ,其 他 形式 的 非 线 性 回归 模 
型 对 模拟 这 些 概率 可 能 效果 会 更 好 。 在 9.2 节 中 我 们 讨论 了 这 些 被 称 为 “probit "回归 和 
“logit” 回归 的 方法 。9.3 节 论 述 了 用 来 估计 “probit" © Ja "logit" 回归 系数 的 方法 , 即 极 大 
羽 然 估计 方法 。 这 节 的 内 容 可 以 是 选择 性 的 。 在 9.4 节 中 ,我 们 将 这 些 方法 应 用 于 波士顿 








抵押 贷款 申请 的 数据 集中 ,看 一 看 在 抵押 公款 市 场 中 是 否 奇 在 种 族 歧 视 的 证 据 。 

本 章 所 者 虑 的 二 元 因 变 时 ,是 个 具有 有 限 范 围 的 因 变 量 的 例子 , 摘 名 话说 , 它 是 个 受 限 
FEB ( limited dependent variable) 。 对 于 其 他 类 型 的 受 限 因 变量 ,例如 取 多 个 离散 值 的 
因 变 醒 , 我 们 在 附录 9.3 中 做 了 讨论 。 


-9.1 因 变 量 与 线性 概率 模型 ] 


不 论 抵押 贷款 申请 被 接受 还 是 被 拒绝 ,都 是 二 元 变量 的 一 个 例子 。 许 多 其 他 重要 的 问 
题 也 涉及 二 元 结果 。 奖 学 金 对 某 个 人 上 大 学 的 决策 的 影响 是 什么 ? 是 什么 因素 决定 青少年 
是 否 吸烟 ? 是 什么 因素 决定 一 国 是 否 能 得 到 外 国 援助 ”是 什么 因素 决定 工作 申请 是 否 成 
功 ? 在 所 有 这 些 例子 中 ,我 们 所 关心 的 结果 都 是 二 元 的 ;学 生 上 大 学 还 是 不 上 大 学 ;青少年 
吸烟 还 是 不 吸烟 ;一 国 得 到 外 国 援助 还 是 没有 得 到 外 国 援助 ,申请 者 获得 了 工作 还 是 没有 获 
得 工作 。 

本 节 论述 了 二 元 因 变 量 回 归 和 连续 因 变量 回归 之 间 的 区 唱 , 然 后 介绍 一 种 含有 二 元 因 
变量 的 最 简单 的 回归 模型 一 -线性 概率 模型 。 
9.1.1 二 元 因 变 量 

本 章 所 研究 的 应 用 问题 是 ,种 族 是 否 是 拒绝 一 项 抵押 贷款 申请 的 一 个 因素 ,相应 的 二 元 
因 变 量 是 , 抵 折 贷 款 申请 是 否 被 拒绝 。 所 用 的 数据 是 波士顿 联邦 储备 银行 的 研究 人 员 在 住 
房 抵 押 披 露 法 ( HMDA) 的 要 求 下 编辑 的 一 个 较 大 数据 集中 的 一 个 子 集 ,而 且 数 据 与 1990 年 
在 马萨诸塞 州 波 土 顿 地 区 所 填写 的 抵 抑 贷款 申请 档案 有 关 。 附 录 9. 1 中 描述 了 波士顿 
HMDA 数据 。 

抵押 贷款 的 申请 是 很 复杂 的 ,银行 信贷 员 的 决定 过 程 也 是 如 此 。 一 个 信贷 员 必须 能 项 
测 该 申请 者 是 否 有 能 力 支付 他 (或 她) 的 贷款 ，- 条 重要 的 信息 就 是 要 求 的 贷款 支付 额 相对 
于 申请 者 收入 的 大 小 。 任 何 贷款 人 都 知道 ,支付 一 项 相当 于 你 月 收入 10% 的 贷款 要 比 支付 
相当 于 你 月 收入 50% 的 贷款 更 容易 。 因 此 ,我 们 首先 看 两 个 变量 之 间 的 关系 :二 元 因 变量 
deny( 如 果 抵 押 贷 款 申请 被 拒绝 ,那么 deny 等 于 1; 和 否则 ,deny 等 于 0) ,以 及 连续 变量 P/I 
ratio( 支付 与 收入 的 比 ) , 它 是 申请 者 的 预期 月 贷款 支付 总 额 与 他 (或 她 ) 的 月 收 人 之 比 。 

图 9 一 1 给 出 了 deny 和 P/I ratio 之 间 关系 的 散 点 图 ,数据 是 从 2 380 个 观察 值 中 裁 到 的 
127 个 (用 数据 集 的 这 个 子 集 更 容易 理解 这 个 散 点 图 ) 。 由 于 变量 deny 是 二 元 变量 ,因此 这 
个 散 点 图 看 起 来 不 同 于 第 2 部 分 的 散 点 图 。 虽然 如 此 , 它 看 上 去 仍然 显示 了 deny 和 Pt 
ratio 之 间 的 关系 :P/ I ratio IEF 0. 3 的 申请 者 很 少 被 拒绝 ,但 是 P/I rario 超过 0.4 的 大 部 
分 申请 者 被 拒绝 了 。 

P/I rasio 和 deny 之 间 的 这 种 正 相关 关系 ( P/I ratio 越 高 ,拒绝 比例 越 大 ) 连同 使 用 这 
127 个 观察 值 所 估计 出 的 OLS 回归 线 ,一 起 反映 在 图 9 一 1 中 。 和 以 前 一 样 ,这 条 回归 线 描 
绘 的 是 把 deny EX P/I ratio 这 一 回归 因 于 的 函数 的 预测 值 。 例 如 , 当 PI ratio =0.3 时 ， 
deny 的 预测 值 是 0. 20。 但 是 ,对 二 元 变量 deny 的 预测 值 为 0. 20 而 言 ,如 何 解释 这 个 数值 的 
含义 呢 ? 

回答 这 个 问题 的 关键 (这 也 是 理解 二 元 因 变 量 回归 的 一 般 性 问题 ) ,是 把 该 回归 关系 解 
释 为 建立 一 个 因 变 量 等 于 1 的 概率 模型 。 这 样 ,预测 值 0. 20 就 可 被 解释 为 , 当 P/I ratio = 
0.3 时 ,估计 出 的 被 拒绝 的 概率 为 20% , 换 句 话说, 如果 有 许多 P/I ratio = 0.3 的 申请 ,那么 
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注 :具有 高 的 债务 支付 与 收 人 比 ( Pr ratio) 更 可 能 使 抵押 贷款 申请 者 的 申请 被 拒绝 (如 果 被 拒绝 ， 
那么 deny = 1 否则 ,deny =0)。 线 性 概率 模型 使 用 直线 建立 以 PI rano 为 条 件 的 被 拒绝 的 概率 模型 。 
图 9 一 1 找 押 贷款 申请 被 拒绝 以 及 支付 与 收入 比 的 散 点 图 
他 们 中 的 20 多 将 会 被 拒绝 。 

这 个 解释 遵循 了 两 个 事实 。 首 先 ,根据 第 2 部 分 的 内 容 ,总 体 回 归 函 数 是 给 定 回归 因子 
RIFF Y AEE, ECY, X... X.) 。 其 次 ,根据 2.2 节 内 容 可 知 , 如 果 了 是 一 个 0 > 
1 的 二 元 变量 ,那么 它 的 期 望 值 (或 均值 ) 就 是 了 =1 时 的 概率 , 即 E(Y) =Pr(Y= l), 在 回 
归 的 意义 下 ,期望值 是 以 回归 因子 的 值 为 条 件 的 ,因此 估计 出 的 概率 是 以 X 为 条 件 的 。 所 
以 对 于 一 个 二 元 变量 ,CTIT X... X.) =sPr(Y=11X,,X,,.. X.) 。 简 而 言 之 ,对 于 一 个 
二 元 变量 ,从 总 体 回 中 函数 中 得 出 的 预测 值 ,就 是 在 给 定夺 条 件 下 了 = 1 的 概率 。 

应 用 于 二 元 因 变 量 的 多 元 线性 回归 模型 ,又 被 称 为 线性 概率 模型 ;之 所 以 称 它 是 “线性 
的 "是 因为 它 是 一 条 直线 ;之 所 以 称 它 是 “概率 模型 "是 因为 它 建立 的 是 一 个 因 变量 等 于 1 
的 概率 模型 ,在 我 们 的 例子 中 , 即 是 贷款 被 拒绝 的 概率 。 


9.1.2 线性 概率 模型 


线性 概率 模型 {linear probability model) ,是 第 2 部 分 中 介绍 的 当 因 变 量 是 二 元 变量 而 
不 是 连续 变量 时 的 多 元 回归 模型 的 称谓 。 因 为 因 变 量 Y 了 是 二 元 变量 ,所 以 总 体 回 归 函 数 对 
应 于 给 定 工 条 件 下 因 变 量 等 于 1 的 概率 。 同 归 因 子 半 的 总 体系 数 包 就 是 与 去 的 单位 变化 
相 联 系 的 了 =1 时 的 概率 的 变化 。 同 理 ,利用 所 估计 的 回归 函数 计算 的 OLS 预测 值 》 ,就 是 
当 因 变量 等 于 1 时 的 预测 的 概率 ,而 OLS 估计 量 房 则 估计 了 与 互 的 单位 变化 相 联 系 的 当 了 
=1 时 预测 概率 的 变化 。 

第 2 部 分 中 几乎 所 有 的 回归 工具 都 可 沿用 到 线性 概率 模型 中 。 系 数 可 以 用 0LS 进行 
由 计 。9%5 台 的 轩 信 区 间 可 被 构造 为 上 1. % 倍 的 标准 误 ; 关 于 几 个 系数 的 假设 检验 可 以 使 用 
第 5 章 中 所 讨论 的 严 统 计量 来 进行 ;而 变量 之 间 的 交互 作用 可 以 使 用 6 3 节 的 方法 来 建 模 。 
由 于 线性 概率 模型 的 误差 总 是 异 方差 的 ( 练习 9. 3) ,因此 应 该 使 用 异 方差 稳健 的 标准 误 进 
行 统计 推断 。 

有 一 个 不 能 沿用 的 工具 是 尼 。 当 因 变 量 是 连续 的 时 ,设想 一 种 R = 1 的 情形 是 可 能 
的 , 即 所 有 数据 恰好 位 于 直线 上 。 当 因 变 量 是 二 元 的 时 , 这 是 不 可 能 的 ,除非 回归 因子 也 是 














二 元 的 。 因 此 ,站 在 这 里 并 不 是 一 个 特别 有 用 的 统计 量 。 下 一 节 我 们 将 会 回 到 拟 合 测量 指 
标的 讨论 上 ， 

线性 概 素 模 型 在 重要 概念 9.1 中 总 结 。 

AR LAB HMDA 数据 中 的 应 用 。 用 我 们 数据 集中 所 有 的 2 380 个 观察 值 所 估计 的 二 元 
EPER deny 对 P/I ratio 的 OLS 回归 方程 是 : 


er 
dens = -0.080 + 0.604 PI rano (9.1) 
(0.032) (0.098) 


所 估计 的 PI ratio 的 系数 是 正 的 , 匡 总 体系 数 在 1% 的 水 平 下 在 统计 上 显著 地 异 于 人 0 
(1 统计 量 是 6. 13) 。 因 而 ,债务 支付 占 收 入 的 比重 越 高 的 申请 者 其 申请 越 有 可 能 被 拒绝 。 
P/I ratio 的 系数 可 被 用 米 计 算 给 定 回 归 因 子 变化 的 条 件 下 ,拒绝 概率 的 预测 变化 。 例 如 , 根 
据 公 式 (9.1) ,如 果 P/I ratio 增加 0 1, 那 么 被 拒绝 的 概率 增加 0. 604 x 0, 1 =0. 06, 即 增加 
6.0 AFM. 


重要 概念 9. 1 f 
线性 概率 模型 
线性 概率 模型 就 是 下 列 的 多 元 线性 回归 模型 : 
Y, =&, +B,X,, th +t +B,X, +u, (9.2) 


其 中 ,了 是 二 元 变量 ,因此 ; 

PAY =LA, ,Ty X) =ñ +B,X, +B,X, + +B,X, 
回归 系数 B, 就 是 在 保持 其 他 回归 因子 不 变 的 情况 下 ,与 X, 的 单位 变化 相 联系 的 了 = 工时 售 
计 概 率 的 变化 ,B, 的 含义 依 此 类 推 。 回 妇 系 数 可 以 用 0LS 方法 进行 估计 ,并 且 通 常 的 ( 异 方 
差 稳健 的 ) OLS 标准 误 可 以 被 用 来 构造 置信 区 间 和 假设 检验 。 


公式 (9.1) 中 所 估计 的 线性 概率 模型 可 被 用 来 计算 作为 P7 ratio 变量 函数 的 预测 的 被 
拒绝 概率 。 例 如 ,如 果 计 划 的 债务 支付 额 是 申请 者 收入 的 30 名 ,那么 PAI ratio 是 0.3, 根 据 
公式 (9. 1) ,预测 值 是 -0. 080 + 0, 604 x0.3 =0. 101, 即 根据 这 个 线性 概率 模型 ,计划 的 债务 
支付 额 占 收入 的 比重 为 30 免 的 申请 者 ,其 申请 具有 10. 1 名 的 被 拒绝 概率 。( 这 个 结论 不 局 
于 以 图 9 一 ! 中 的 回归 线 为 基础 得 出 的 20% 的 概率 ,因为 那 条 直线 只 用 了 被 用 于 估计 公式 
(9.1) 的 2 380 个 观测 值 中 的 127 个 。) 

保持 P/I ratio 不 变 的 条 件 下 ,种 族 对 被 拒绝 概率 的 影响 是 什么 ?为 了 使 问题 简化 ,我 
们 关注 黑人 申请 者 和 白人 申请 者 之 间 的 差异 。 为 了 估计 种 族 的 影响 ,我们 保持 P ratio 不 
变 ,以 一 个 二 元 回归 因子 来 扩展 公式 (9. 1) ,这 个 回归 因子 在 申请 者 是 黑 入 时 等 于 1, 在 申请 
者 是 白人 时 等 于 0, 所 估计 的 线性 概率 模型 是 : 


~ 
deny = -0.091 + 0.559 P/I ratio+ O 177 black (9.3) 
(0.029) (0.089) (0 0255 


black 的 系数 是 0.177 ,表明 在 保持 他 们 的 P/I ratio 不 变 的 情况 于 3638459181 À RE 
抵押 贷款 的 申请 被 拒绝 的 概率 比 白 人 申请 者 高 出 17. 7% 。 这 个 系数 在 1% 的 水 平 下 在 统计 
上 是 显著 的 (1 统计 量 是 ?7. 11)。 

按 字 面 意思 ,这 个 估计 值 表明 在 抵押 贷款 决策 方面 可 能 存在 种 族 歧视 ,但 是 得 出 这 样 的 结 
沦 可 能 为 时 尚 里。 尽管 PXI ratio 对 信贷 员 的 决策 起 作用 ,但 是 许多 其 他 的 因素 也 起 作用 ,诸如 
申请 者 的 潜在 收入 和 个 人 信用 记录 。 如 果 这 些 变量 中 的 任何 变量 与 回执 因子 black 或 PA 
ratio 相关 ,那么 在 公式 (9.3) 中 忽略 它们 将 会 引起 遗漏 变 量 偏 差 。 这 样 ,在 我 们 于 9.3 节 做 出 


更 彻底 的 分 析 之 前 ,我 们 必须 推迟 得 出 任何 关于 抵押 贷款 上 存在 种 族 歧 视 的 结论 。 

线性 概 涂 模型 缺点 。 使 线性 概率 模型 易于 使 用 的 线性 特征 也 正 是 它 的 主要 缺点 。 再 看 
看 图 9 一 1 :表示 预测 概率 的 那 条 估计 线 对 于 很 低 的 PI ratio 值 落 在 0 以 下 ,而 对 于 较 高 的 
值 则 超过 1! 但 是 ,这 是 无 意义 的 ,因为 概率 不 可 能 小 于 0 或 者 大 于 1。 这 个 无 意义 的 特征 
是 线性 回归 不 可 避免 的 结果 。 为 了 解决 这 个 问题 ,我 们 引 人 特 别 为 二 元 因 变量 设计 的 新 的 
非 线性 模型 , 即 probit 和 logit 回归 模型 。 


9. 2 probit 和 logit 回归 - 


probit 和 logt? 回归 是 特别 为 二 元 因 变 量 设计 的 非 线 件 回 归 模 型 。 因 为 渡 有 二 元 因 变 
基 了 的 回 妇 建立 了 了 = 1 时 的 概率 模型 ,所 以 ,采用 迫使 预测 值 在 0 和 1 之 间 的 非 线性 表达 
式 是 有 意义 的 。 由 于 累积 概率 分 布 函 数 (c. d f. ) 产 生 0 和 1 之 间 的 概率 ( 兄 2.1 节 ) ,因此 
它们 被 用 在 probit 和 logit 的 回归 中 。prohit 回归 使 用 了 标准 正 态 分 布 的 e. d £, logit 回归 ， 
也 被 称 为 logistic 回归 (logistic regression) ,使 用 了 "logistic” c. d. f. 。 


9. 2. 1 probit 回归 


含有 单个 回归 因子 的 probit 回归 。 会 有 单个 回归 因子 区 的 probit 回归 模型 是 ， 
Pr{F=11X) = @(A, +B,X) (9.4) 

其 中 ,更 是 累积 标准 正 态 分 布 函数 (已 制 成 表格 , 见 附 表 1)。 

例如 , 假 没 了 是 二 元 抵押 被 拒绝 变量 deny, X EAA MZ E (P/I ratio) , B, = 
-2,8 =3, 那 么 如 果 PI ratio =0.4, 被 拒绝 的 概率 是 多 少 ? 根据 公式 (9.4) ,这 个 概率 是 
BB, +B PI ratio) = b( -2 +3P/I ratio) =$( -2+3 x0.4) =@( -0.8)。 根 据 累 积 正 态 
Aha UHEL), Ø -0.8) =Pr(Z= -0.8) =21.2 驳 。 也 就 是 说 , 当 PI ratio 是 0.4 BF, 
使 用 系数 所 = -2 和 局 =3 时 probit 模 型 计算 出 来 的 申请 被 拒绝 的 预测 概率 是 21.2%。 

在 probit 模型 中 ,Bo + BX 项 在 附 表 1 的 累积 标准 正 态 分 布 表 中 起 “z" 的 作用 。 这 样 ,前 
一 段 中 欧 计 算 可 以 等 价 地 按 忆 下 方式 做 ,首先 计算 “z 值 ” ,zs = B, +BY -2+3x04= 
~0.8, 然 后 查找 z= -0.8 左边 的 正 态 分 布 尾 部 概率 , 它 是 21.2%。 

如 果 公 式 (9.4) 中 的 B, 是 正 的 ,那么 兰 增 可 会 提高 了 = 1 时 的 概率 ;如 果 启 是 负 的 , 那 
么 XX 增加 会 降低 了 =1 时 的 概率 。 然 而 , 除 此 之 外 ,不 容易 直接 解释 probit 的 系数 认 和 有 。 
相反 ,最 好 通过 计算 概率 和 /或 概率 的 变化 来 间接 地 进行 解释 。 如 果 只 有 一 个 回归 因子 , 那 
么 解释 probit 回归 最 容易 的 方法 就 是 用 图 了 示 方 法 标 出 概率 。 

根据 前 面 散 点 图 中 的 127 个 观测 值 , 图 9 一 2 绘制 了 deny 对 P/I ratio 的 probit 回归 所 生 
成 的 估计 回归 函数 。 所 知 计 的 probit 回归 函数 呈现 伸 长 的 “5” 形 :对 较 小 的 PI ratio 值 面 
言 , 它 接近 于 0 而 且 是 平 的 ;对 中 间 的 值 而 言 , 它 变 得 弯曲 而 且 上 升 ;而 对 很 大 值 而 言 , 它 又 
变 平 了 ,而 且 接近 于 1。 对 较 小 的 P/I ratio 值 而 言 ,被 拒绝 的 概率 很 小 。 例 如 , 当 P ratio = 
0.2 时 ,依据 图 9 一 2 中 所 估计 的 probit 函数 ,所 估计 的 被 拒绝 概率 是 Pr(deny = 11P/] ratio = 
0.2) =2. 1% ; 4 P/I ratio =0.3 时 ,所 估计 的 被 拒绝 概率 是 16. 1% ; 4 P/I ratio =0.4 时 ,被 
拒绝 概率 陡 增 到 51. 9% ; 面 当 P/I ratio =0.6 时 ,被 拒绝 概率 是 98. 3 名 。 根 据 这 个 所 个 计 的 
probit 模型 ,对 高 PA ratio 值 的 申请 者 而 言 ,被 拒绝 的 概率 接近 于 1。 
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注 :proh 模型 使 用 累积 正 态 分 布 函数 来 建立 给 定 支付 与 收入 比 (PT ratio] 条 件 下 的 被 拒绝 概率 模 
型 ,或 者 更 一 般 地 说 ,建立 Pr(Y= 114) 的 模型 。 不 像 线性 概率 模 避 ,prmbil 条 件 概率 总 是 在 0 和 1 ZM 
图 9 一 2 给 定 P ralio 下 ,被 拒绝 概率 的 probit 模型 

多 个 问 册 因子 的 probit 回 由 。 到 目前 为 止 ,我 们 已 研究 的 所 有 回归 癌 题 都 可 能 导致 址 
沁 变 量 偏 差 , 不 过 我 们 把 一 个 与 回归 因子 相关 的 对 了 的 决定 性 因素 省 赂 了 ,probit 回归 也 不 
例外 。 在 线性 回归 中 ,解决 的 方法 是 把 额外 的 变量 包括 进来 作为 回归 因子 ,这 也 是 解决 
probit 回归 中 进 泪 变量 偏差 的 方法 。 

多 个 回归 因子 的 probit 模型 ,通过 增加 回归 因子 计算 x 值 , 将 单个 回归 因子 的 probit 模 
型 进行 了 推广 ,因此 ,含有 两 个 回归 因子 大 fl X, 的 probi 总 体 回归 模型 是 ， 

Pr( Y= IX, X.) = P(B, +B,X, +B,X,) (9.5) 

例如 ,假设 B= -1.6,8, =2,8B.=0. 5,308 X =0.4 H X, =1, 那 么 z 什 是 z= -1.6+2 
x0.4+0.5x1= -0.3。 因 此 ,给 定 X =0.4,X, =1 和 Y=1 条 件 下 ,相应 的 概率 就 是 Pr(Y 
=1|X, =0.4,X, =1) =( -0.3) =38%, 

变化 的 效应 。 一 般 地 ,XX 变化 对 了 的 效应 就 是 六 变化 所 引起 的 了 的 期 望 变化 。 当 了 
是 二 元 变量 时 , 它 的 条 件 期 望 就 是 它 等 于 1 时 的 条 件 概率 ,因此 ,X 变化 所 引起 的 了 的 期 望 
变化 就 是 Y=1 时 的 概率 的 变化 。 

回想 一 下 6. 1 节 的 内 容 , 当 总 体 回 归 应 数 是 的 非 线 性 隙 数 时 ,这 个 期 望 变化 可 分 三 步 
进行 估计 ;第 一 步 , 利 用 所 估计 的 回归 函数 ,在 无 的 初始 值 处 计算 方程 的 预测 值 ;第 二 步 , 在 
X FETA X + AX 处 计算 方程 的 预测 值 ;第 三 步 ,计算 这 两 个 预测 值 的 差 。 这 个 程序 在 重要 
概念 6.1 做 了 总 结 。 正 像 和 上 节 中 所 强调 的 一 样 ,不 论 该 非 线 性 模型 如 何 复杂 ,这 个 方法 对 
计算 了 变化 的 预测 效应 总 是 有 效 的 。 如 果 将 重要 概念 6. 1 中 的 方法 应 用 到 probit 模型 中 ， 
那么 会 得 出 变化 对 了 =1 时 概率 的 估计 效应 。 

probit 回归 模型 ,预测 概率 和 估计 效应 ,在 重要 概念 9. 2 中 做 了 总 结 。 


重要 概念 9.2 


probit 模型 .预测 概率 和 估计 效应 
会 有 多 个 回归 因子 的 总 体 probit 模型 是 : 
Pr 了 = 1Y,,X,,:- X.) BB, +AA +B,X, + +B,X,) (9.6) 
其 中 , 因 变 量 了 是 二 元 变量 $ RRRRELS IMEA, X. X 等 是 回归 因子 。Probit 系数 


Bo B, 等 没有 简单 的 解释 方法 ,最 好 通过 计算 预测 概率 和 估计 回归 因子 变化 的 效应 来 解释 
这 个 模型 。 

BA X X, X, 的 值 ,了 = 工时 的 预测 概率 是 这 样 计 算 的 :通过 计算 ?> 值 , 即 z= 包 + 
BX, + +B X, RAEES ERUR 1) 中 查找 这 个 = 值 所 对 应 的 预测 概率 。 

回归 因子 变化 的 咎 计 效应 是 按 以 再 步骤 计算 的 :(1) 对 回归 因子 的 初始 值 计算 预测 概 
率 ;(2) 对 回归 因子 的 新 值 或 者 变化 后 的 值 计算 预测 概率 ;(3) 求 它们 的 差 。 


任 抵 拓 贷 丈 数 据 中 的 应 用 。 作 为 一 个 例子 ,我 们 拟 合 了 数据 集中 2 380 个 观测 值 的 抵 
押 贷 款 的 deny 和 PAI ratio 的 probit 模型 ， 


— —— 
Pr(deny = 11P/Zl raho) =b(-2.19 + 2.97 P/I ratio) (9.7) 
(0.16) (0.47) 


估计 系数 -2. 19 和 2. 97 的 直观 意义 很 难 解释 ,因为 它们 通过 z 值 影响 了 被 拒绝 概率 - 
实际 上 ,从 公式 (9.7) 所 千 计 的 probit 回归 中 容易 断定 的 惟一 一 件 事 是 P/I ratio 与 被 拒绝 概 
率 正 相关 ( P/] ratio 系数 是 正 的 ) ,而 且 这 个 关系 在 统计 上 是 显著 的 (t=2.9770.47 =6. 32), 

但 是 , 当 P/I ratio 从 0.3 增加 到 0.4 时 ,申请 被 拒绝 的 预测 概率 的 变化 是 多 少 ? 为 了 回 
管 这 个 问题 ,我 们 遵循 重要 概念 6. 1 中 的 方法 :计算 P/I ratio =0. 3 时 的 被 拒绝 概率 ,然后 计 
算 P/I ratio =0.4 时 的 被 拒绝 概率 ,最 后 计算 这 两 个 被 拒绝 概率 的 差 。 当 PT ratio =0.3 时 
时 ,被 拒绝 概率 是 更 ( -2 19 +2.97 x0.3) =@( -1.30) =0.097, 当 PATratio = 0. 4 时 ,被 拒 
绝 概 率 是 P -2.19 +2.97 x0.4) = @( - 1.00) =0.159, 被 拒绝 概率 的 估计 变化 就 是 
0. 159 -0. 097 =0. 062。 也 就 是 说 ,PT ratio 从 0. 3 增加 到 0.4, 相 应 的 被 拒绝 概率 从 9.7%% 
增加 到 15.9% ,增加 了 6.2 个 月 分 点 。 

由 于 probit 回归 函数 是 非 线性 的 ,因此 文 变化 的 效应 依赖 于 不 的 初始 值 。 例 如 ,如 果 P/I 
ratio =0. 5 ,那么 基于 公式 (9. 7) 所 估计 的 被 拒绝 概率 是 D -2.19 +2.97 x0.5) =@ ( -0.71) 
=0.239, H, P7 ratio 从 0.4 增加 到 0.5 时 ,预测 概率 的 变化 是 0.239 —0. 159 =0.080 ,或 
8.0 个 百分点 ,大 于 当 PI ratio 从 0.3 增加 到 0.4 时 增加 的 6.2 个 自分 点 。 

如 果 保 持 PZI ratio 不 变 , 那 么 种 族 因 素 对 抵押 贷款 被 拒绝 概率 的 影响 是 什么 ? 为 了 全 
计 这 个 影响 ,我 们 估计 了 PA ratio 和 black 作为 回归 因子 的 probit 回归 方程 ， 


— T. 
Pr( deny = 1 |P/1 rato black) = (-2.26 + 2.74 PI ratwo + 0.71 black) (9.8) 
(0.16) (0.44) (0.083) 


虽然 仍旧 很 难 解释 系数 值 的 直观 意义 ,但 是 并 不 难 解释 其 符号 和 统计 显著 性 。black 的 系数 
是 正 的 ,表明 如 果 保 持 他 们 的 PZI ratio 不 变 , 那 么 美 籍 非洲 黑人 申请 者 的 被 拒绝 概率 比 白 
人 申请 者 高 。 这 个 系数 在 1% 的 水 平 下 在 统计 上 是 显著 的 ( Black 系数 的 :统计 量 是 8.55)。 
对 PI ratio =0.3 前 白人 申请 者 而 言 ,预测 的 被 拒绝 概率 是 7. 5% ,而 对 PA ratio =0.3 的 黑 
人 申请 者 而 言 ,预测 的 被 拒绝 概率 是 23. 3% ,这 两 个 假设 申请 者 的 被 拒绝 概率 之 差 是 15. 8 
个 百分点 。 

probit 系数 的 估计 。 这 里 所 给 出 的 probit 系数 是 使 用 极 大 似 然 方法 估计 的 。 在 多 种 应 
用 中 ,包括 在 二 元 因 恋 量 回归 中 , 极 大 估 然 方法 生成 有 将 的 ( 最 小 方差 ) 个 计量 。 在 大 样本 
条 件 下 , 极 大 似 然 估计 量 是 一 致 的 且 服 从 正 态 分 布 ,因此 能 够 用 通常 方法 构造 系数 的 :统计 
量 和 置信 区 间 。 

{Eit probit 模型 的 回归 软件 典型 地 合用 极 大 似 然 知 计 方 法 ,因此 , 它 是 实际 应 用 的 一 种 
简单 方法 。 这 样 的 软件 所 生成 的 标准 误 同 样 能 被 用 做 为 回归 系数 标准 误 ,例如 ,真实 probit 








系数 的 %5 名 的 署 信 区 间 可 被 构造 为 佑 计 系 数 + 1. 96 倍 的 标准 误 。 同 样 ,使 用 极 大 似 然 估计 
星 计 算出 的 下 统计 其 也 能 够 用 于 检验 联合 假设 。 极 大 似 然 佑 计 在 9. 3 节 中 做 了 进一步 讨 
论 ,在 附录 9.2 中 给 出 了 另外 的 细节 。 


重要 概念 9.3 


logit 回归 
含有 多 个 回归 因子 的 二 元 因 变 量 了 的 总 体 logit 模型 是 ， 
PrF =X .X,,-. A) = FOB +A +8&,X, t+) 





(9.9) 





"1 ge PA at A 


除了 累积 分 布 函 数 不 同 以 外 ,logit 回归 与 probit 回归 类 似 。 


9.2.2 logit 回归 


logit EOX, logit 回归 模型 类 似 于 probit 回归 模型 ,区 别 主要 是 公式 (9.6) 中 的 累积 
标准 正 态 分 布 函数 D 被 累积 标准 Iogistic HARARET. RIA 下 表示 黑 积 标准 logistie 
DRRR ,在 重要 概念 9. 3 中 总 结 了 logit jH, logistie 分 布 函数 是 一 种 用 指数 函数 定义 的 
特定 的 函数 形式 ,如 公式 (9.9) 中 的 最 后 一 个 表达 式 所 给 出 的 那样 。 

和 解释 probit 系数 一 样 , 最 好 通过 计算 预测 的 概率 以 及 预测 的 概率 之 差 来 解释 logit 
系数 。 

logit 模型 的 系数 可 以 用 极 大 似 然 法 估计 。 在 大 样本 条 件 下 ,和 极 大 似 然 估 计量 是 一 致 的 
且 正 态 分 布 的 ,因此 可 以 用 通常 方法 构造 系数 的 上 统计 量 和 置信 区 间 。 

logt 回归 函数 与 prohit 回归 函数 是 要 似 的 ,图 9 一 3 证 明了 这 一 点 。 图 9 一 3 描绘 出 了 
使 用 与 图 9 一 1 和 图 9-~2 中 相同 的 127 个 观察 值 ,利用 极 大 似 然 法 所 估计 的 因 变量 deny 和 
单个 回归 因子 P/I ratio 的 probit 与 logit 回归 函数 。 这 两 个 桨 数 之 间 的 差异 很 小 。 

















0.2 0.3 


”支付 与 收入 比 


注 ;给 定 支付 与 收入 比 CPYT rato) 条 件 下 ,这 些 probit 和 logit 模型 生成 了 几乎 相同 的 抵押 贷款 申请 


被 拒绝 的 概率 估计 值 。 
图 9 一 3 给 定 P4 向 如 条 件 下 , HEER probit 和 logit 模型 


历史 上 ,logit 回归 发 展 的 主要 动因 是 logistic RRHH BAT ARRES AR 





p. 








9. 3.1 非 线性 最 小 二 乘 估计 


ÍË probit 模型 的 系数 一 样 , 当 未 知 系数 以 非 线 性 方式 进入 总 体 回归 阔 数 时 , 非 线 性 最 小 
二 乘 是 估计 问 归 晒 数 未 知 条 数 的 一 般 方 法 。 
让 我 们 回顾 5.3 节 中 关于 多 元 线性 回归 模型 系数 的 DLS 佑 计量 的 讨论 。015 佑 计量 


使 公式 (5.8) 中 的 预测 误差 平方 和 > [Y.- (be +b Xi + +b.X,) 1 达到 最 小 。 原 则 土 


说 ,可 以 通过 检查 加 ,名 三 的 多 次 试验 值 并 确定 那些 能 够 使 误差 平方 和 最 小 的 值 来 计算 
OLS 估计 量 。 

可 以 使 用 同样 的 方法 估计 probit 系数 。 由 于 该 回归 模型 是 关于 系数 的 非 线 性 关系 , 因 
此 这 种 方法 被 称 为 非 线性 最 小 二 乘 。 对 一 组 试验 系数 值 b,b 等 ,构造 预测 误差 平方 和 ， 


> Y,- Dib +b. X, + + bX) (9.11) 


土 式 与 线性 回归 模型 的 误差 平方 和 是 一 样 的 ,只 是 这 里 的 回归 明 数 是 由 probit 模型 给 出 的 。 
probi! 模型 系数 的 非 线性 最 小 二 乘 佑 计量 { nonlinear least squares estimator} ,就 是 使 表达 
式 (9. 11) 中 的 预测 误差 平方 和 最 小 的 b.,b.. b. 的 值 。 同 理 , 以 logistic 分 布 晴 数 下 代替 
表达 式 (9. 11) 中 的 更 ,logit 模型 系数 的 非 线性 最 小 二 乘 佑 计量 可 使 预测 误差 平方 和 达到 
最 小 。 

在 线性 回归 模型 中 ,很 幸运 有 一 个 公式 将 0LS 估计 量 表示 成 数据 的 函数 。 不 幸 的 是 ， 
对 probit 模型 却 没有 这 样 的 公式 ,因此 非 线 性 最 小 二 乘 估 计量 的 值 必须 由 计算 机 来 求 。 丁 
归 分 析 的 软件 已 经 把 求解 这 个 最 小 化 问题 的 复杂 算法 的 计算 程序 置 人 其 中 ,因此 ,在 实践 中 
计算 非 线性 最 小 二 乘 佑 计量 的 工作 可 大 大 减少 。 

probit 系数 的 非 线 人 性 最 小 二 乘 估计 量 拥 有 线性 回归 中 OL 傅 计 量 的 两 个 重要 性 质 ; 它 
是 一 致 的 (和 随 着 样本 容量 的 增 大 , 它 悍 过 真 值 的 概率 接近 1) 且 在 大 样本 条 件 下 是 正 态 分 布 
的 。 丰 过 ,还 存在 比 非 线性 最 小 二 乘 估计 量 有 更 小 方差 的 估计 量 ,也 就 是 说 , 非 线性 最 小 二 
乘 估 计量 是 无 效 的 估计 量 。 和 由 于 这 个 原因 ,probit 系数 的 非 线 性 最 小 二 乘 估 计量 在 实际 中 
很 少 被 使 用 ,而 常用 极 大 似 然 法 来 估计 参数 。 


9.3.2 极 大 似 然 估计 


IRRA likelihood function) 是 数据 的 联合 概率 分 布 ,可 将 其 看 做 是 未 知 系数 的 畏 数 。 
未 知 系 数 的 极 大 似 热 估 计量 (maximum likelihood estimator ,简写 为 MLE] 是 指 那些 使 似 然 
函数 最 大 化 的 系数 值 。 由 于 MLE 是 选择 那些 使 似 然 函数 最 大 化 的 未 知 系 数 ,而 似 然 困 数 反 
过 来 又 是 该 数据 的 联合 概率 分 布 , 因 此 实际 上 ,MLE 选择 的 参数 的 值 , 是 使 实际 被 观测 到 的 
数据 被 抽取 的 概率 最 大 化 的 参数 值 。 在 这 个 意义 下 , MLE 就 是 “最 可 能 "生成 该 数据 的 参 
数值 。 

为 了 举例 说 明 极 大 似 然 合计 ,考虑 一 个 没有 回归 因子 的 二 元 因 变 量 的 两 个 独立 同 分 布 
的 观测 值 7 和 防 。 这 里 ,了 是 一 个 贝 努 里 { Bemoulli) 随机 变量 ,而 惟一 要 估计 的 未 知 参 数 
是 Y=1 的 概率 5, 它 也 是 了 的 均值 。 

为 了 得 到 极 大 似 然 知 计量 ,我 们 需要 偶然 函数 的 表达 式 ,这 反 过 来 又 需要 数据 的 联合 概 
率 分 布 表 达 式 。 上 面 的 两 个 观察 值 六 和 v, 的 联合 概率 分 布 是 Pr( Y, = y, , Y; wA 因为 
Y, 和 了 是 独立 分 布 的 ,联合 分 布 是 两 个 个 别 分 布 的 积 (公式 (2.21)) Br Pr( Y, = 























y.) =PrCY =yi)Pr( 了 =y,)。 贝 努 里 分 布 可 以 用 下 式 来 归纳 :Pr( 了 =y) =p (1 -p) 一 ,其 
中 当 y=1 时 ,Pr 了 Y=1) =p'(1-p) "=p; 当 y=0 时 ,Pr( 了 Y=0) =p (1-p)' =1-p。 这 样 ， 
Y, AY, 的 联合 概率 分 布 就 是 Pr =, Y, syp [pd -p n] x [pl -p >]= 
pin t] —p} tm. 
似 然 函数 就 是 该 联合 概率 的 分 布 ,可 把 它 看 做 是 未 知 系数 的 畏 数 。 对 贝 努 里 随机 变 基 
的 n=2 个 独立 同 分 布 观测 值 而 言 , 似 然 函 数 是 : 
Jo Y Y.) = (9.12) 
p 的 极 大 似 然 佑 计量 就 是 使 公式 (9. 12) 中 的 似 然 函数 最 大 化 的 p 值 。 同 所 有 的 最 大 化 
和 最 小 化 问题 一 样 , 这 个 问题 可 通过 反复 试验 来 解决 ,也 就 是 说 ,你 可 以 试 不 同 的 p 值 并 计 
算 相 应 的 似 然 函 数 JLp; 了 ,了 ,) ,直至 你 相信 你 已 使 这 个 函数 最 大 化 为 止 。 不 过 ,在 这 个 例 


子 中 ,使 用 微 积分 来 使 似 然 函 数 最 大 化 会 生成 一 个 MLE 的 简单 公式 :MLE SE p= (Y, + 


Ya) KAEH, p 的 MLE 正好 是 样本 平均 值 1! 事实 土 ,对 于 一 般 的 4, 贝 努 里 概率 p 的 MLE 
的 $ 就 是 样本 均值 , 即 p = Y( 这 在 附录 9 2 中 证 明 ) 。 在 这 个 例子 中 ,MLE 就 是 通常 的 p 的 
估计 量 , 即 样本 中 也 =1 时 次 数 的 比率 。 

这 个 例子 与 估计 probit 和 logit 回归 模型 未 知 系数 问题 很 类 似 。 在 那些 模型 中 ,成 功 概 
率 p 并 不 是 常数 ,而 是 依赖 于 工 ,也 就 是 说 , 官 是 以 并 为 条 件 的 成 功 概 率 , CTE probit 模型 方 
程 (9.6) 中 和 logit 模型 方程 (9.9) 中 已 给 出 。 因 此 ,probit 和 logit 似 然 函数 与 公式 (9. 12) 中 
的 似 然 函数 相似 ,除了 其 中 的 成 功 概率 随 观 测 值 的 变化 而 变化 ( 因为 它 依赖 于 X,) 之 外 。 附 
录 9.2 中 给 出 了 probit 和 logit 似 然 函 数 的 表达 式 。 

像 非 线性 最 小 二 乘 估计 一 样 ,在 大 样本 条 件 下 MLE 也 是 一 致 性 的 和 正 态 分 布 的 。 因 
为 回归 软件 通常 计算 probit 系数 的 MLE ,所 以 实践 中 很 容易 使 用 这 个 佑 计量。 本 章 所 给 出 
的 所 有 probit 和 logit 模型 的 估计 系数 都 是 MLE。 

基于 MLE 的 统计 推断 。 由 于 在 大 样本 条 件 下 ,MLE 是 正 态 分 布 的 ,因此 基于 MLE 的 
probit 和 logit 系数 的 统计 推断 ,与 基于 OLS 估计 量 的 线性 回归 函数 系数 的 推断 方法 相同 ,也 
就 是 说 ,可 使 用 :统计 量 进行 假设 检验 ,可 使 用 5% 的 置信 水 平 来 构造 +1.96 信和 标准 误 的 
置信 区 间 。 可 使 用 中 统计 量 对 多 个 系数 的 联合 假设 进行 检验 ,这 在 某 种 程度 上 与 第 5 章 所 
讨论 的 线性 回归 模型 的 窗 验 类 似 。 所 有 这 些 都 和 线性 回归 模型 中 的 统计 推断 完全 类 似 。 

在 实践 中 的 一 个 重要 问题 是 , 某 些 统计 软件 使 用 正统 计量 报告 联合 假设 的 检验 结果 ， 
而 另 一 些 软件 则 使 用 卡 方 统计 量 报告 检验 结果 。 卡 方 统计 量 是 9 x ,其 中 q 是 被 检验 的 约 
束 条 件 的 个 数 。 因 为 在 零 假 设 下 ,在 大 样本 中 统计 量 服 从 X74 分 布 ,所 以 9x 瑟 服从 各 
分 布 。 由 于 这 两 个 方法 的 区 别 只 是 是 否 被 g 来 除 ,因此 它们 得 到 的 推断 是 相同 的 ,但 是 你 需 
要 知道 软件 中 执行 的 是 哪个 方法 ,以 便 你 使 用 正确 的 临界 值 。 


9.3.3 拟 合 优 度 测 量 


在 9.1 节 中 ,我 们 曾经 提 到 RR 对 于 线性 概率 模型 是 个 不 好 的 拟 合 测量 。 这 个 结论 也 同 
样 适用 于 probit 和 logit 回归 。 对 于 二 元 因 变 量 模 型 ,有 两 个 拟 合 测量 , 即 “ 被 正确 地 预测 的 
比重 "和 “ 檀 及 ”。 被 正确 地 预测 的 比重 {fraction correctly predicted) 使 用 如 下 规则 :如 果 
Y. =1 且 预 测 概率 超过 50% ,或 者 如 果 了 =0 且 预 测 概 率 小 于 50% ,那么 就 说 7 被 正确 地 预 
测 了 ;否则 就 说 7 被 不 正确 地 预测 了 。“ 被 正确 地 预测 的 比重 "就 是 在 个 观测 值 阅 ,…， 
中 被 正确 地 预测 的 部 分 所 占 的 比重 。 








这 个 拟 合 测量 的 优点 是 易于 理解 ,缺点 是 它 没有 反映 预测 的 质量 :如 条 Y, = ,那么 无 
论 项 测 概率 是 51% 还 是 90% ,观测 值 都 被 看 做 是 被 正确 地 预测 了 。 

伪 R° (pseudo - 昌 *) 利 用 似 然 函数 测量 了 模型 的 拟 合 程度 。 由 于 MLE 最 大 化 了 似 然 
函数 ,因此 ,就 像 在 OLS 悄 计 的 线性 回 轨 中 增加 向 归 因 子 一 定 会 减少 残 差 平 方 和 一 样 , 同 
probit 和 logi 模型 中 添加 额外 的 回归 因子 也 一 定 会 增 大 最 大 化 似 然 函数 的 信 。 这 表明 , 通 
过 比较 合 有 全 部 回归 因子 的 最 大 化 似 然 函 数 的 值 和 无 回归 因子 的 似 然 函 数 的 值 ,可 以 测量 
probit 模型 的 拟 合 质量 ,实际 上 这 就 是 伪 正 所 做 的 工作 。 附 录 9.2 中 给 出 了 伪 尼 的 计算 
公式 。 


.4 在 波士顿 HMDA 数据 案例 中 的 应 用 - 


前 两 节 的 回归 分 析 表 明 ,黑人 申请 者 的 被 拒绝 率 训 比 日 人 申请 者 的 被 拒绝 率 高 ,如 果 保 
持 他 们 的 P/I ratio 林 变 。 不 过 , 当 信贷 员 决 定 一 项 托 摆 贷款 申请 时 ,他 们 会 合理 地 权 和 仁 许 
多 因素 ,如 果 那 些 其 他 因素 中 的 任何 一 个 因素 因 种 族 因素 而 系统 地 不 同 ,那么 到 目前 为 止 所 
考虑 的 佑 计量 就 会 有 遗漏 变量 偏差 。 

在 本 节 中 ,我 们 更 进一步 地 了 解 一 下 在 波士顿 EMDA 数据 中 是 否 存在 种 族 歧视 的 统计 
证 据 。 具 体 来 说 ,我 们 的 目的 就 是 要 在 保持 当 一 个 信 贫 员 决 定 一 项 抵押 贷款 申请 时 所 合理 
考虑 的 申请 者 的 特征 不 变 的 请 况 下 ,估计 种 族 因素 对 被 拒绝 概率 的 影响 。 

在 波士顿 HMDA 数据 集中 ,信贷 员 通过 抵押 贷款 申请 可 以 获得 的 最 重要 的 变量 列 在 表 
9 一 1 中 ,这 些 变量 都 是 我 们 在 贷款 决策 实证 模型 的 分 析 中 将 集中 关注 的 变量 。 前 两 个 变量 
是 对 所 提出 的 一 笔 贷 款 对 贷款 申请 者 造成 的 财务 负担 的 直接 测量 ,以 他 (或 她 ) 的 收入 来 测 
量 。 第 一 个 变量 是 P/I ratio; 第 二 个 变革 是 与 购房 相关 的 费用 和 收入 之 比 。 接 下 来 的 变量 
是 贷款 额 与 房屋 评估 价值 的 比值 。 如 果 贷 款 与 价值 的 比 接近 1, 那么 如 果 申 请 者 拖欠 贷款 
而 且 银 行 取消 了 抵押 品 的 财 回 权 ,银行 在 获得 全 部 贷款 疾 补 偿 方面 将 遇 到 麻烦 。 最 后 三 个 
财务 变 基 总 结 了 申请 者 的 信用 史 。 如 果 一 个 申请 者 过 去 在 偿 清 债务 方面 一 直 不 很 可 靠 , 那 
么 该 信 伐 员 会 合理 地 考虑 该 串 请 者 将 来 是 否 有 能 力 支 付 该 笔 抵 押 贫 款 ,或 者 他 或 她 是 否 想 
在 将 来 归还 该 笔 贷 款 。 这 三 个 变量 测量 了 不 同类 型 的 信用 史 , 信 和 贷 员 在 对 这 三 个 变量 进行 
分 析 时 可 能 分 别 给 予 不 同 的 权重 。 第 一 个 变量 涉及 消费 者 信用 , 比如 信用 卡 债务 ;第 二 个 变 
量 涉 及 以 前 的 抵押 支付 史 ; 第 三 个 变量 测量 了 那些 非常 严重 的 信用 问题 ,这 些 信 用 问题 已 经 
在 公开 的 法 律 档案 做 了 记载 ,例如 呈请 破产 备案 。 

表 9 一 1 还 列 出 了 对 信贷 员 决 策 起 重要 作用 的 其 他 几 个 变量 。 有 了 时 申请 者 必须 申请 私 
人 抵押 保险 .了 信贷 员 需 要 知道 该 保险 申请 者 是 否 被 拒绝 ,以 及 这 种 拒绝 是 否 会 对 信贷 员 
的 决策 产生 负面 影响 。 接 下 来 的 三 个 变量 与 申请 者 的 预期 偿还 能 力 有 关 , 它们 涉及 申请 者 
的 就 业 状况 .婚姻 状况 和 受 教育 水 平 。 一 旦 取消 抵 抑 品 赎 回 权 , 那 么 财产 特征 也 是 很 重要 
的 ,下 一 个 变量 表明 了 财产 是 否 是 共管 的 。 表 9 一 1 中 的 最 后 两 个 变量 一 个 是 申请 者 是 黑人 
还 是 白人 , 另 一 个 是 申请 是 否 被 拒绝 。 在 这 些 数据 中 ,14.2 名 的 申请 者 是 黑人 ,12.0 和 的 申 
请 被 拒绝 。 

9 2 给 出 了 基于 这 些 变量 的 回归 结果 。 第 (1) ~ 第 (3? 列 中 所 给 出 的 基准 设 定 包括 
表 9 一 1 中 的 财务 变量 ,表示 私人 抵押 保险 是 否 被 拒绝 的 变量 以 及 申请 者 是 否 是 自我 就 业 的 











$ ERRE ERM MARERA, MARMA i IA RR D R RTE A EER, 在 本 案例 的 
研究 期 间 , 如 果 贷 款 与 价值 比 超过 中 % ,那么 一 般 要 求 申请 者 购买 抵押 保险 。 













































































表 9 一 ! 抵押 贷款 决策 的 回 当 模型 所 包括 的 变量 
变量 名 称 EX 样本 均值 
HI Eht 
P/T rato 月 度 总 情 务 支付 额 与 上 月度 总 收 人 之 比 0.331 
Housing expense-to- 
Pe 月 度 住房 费用 与 月 度 总 收入 之 比 0.255 
Poan-to-ualue ratio 贷款 规模 与 财产 评估 价值 之 比 0. 738 
Consumer credit score 1 :如 果 没 有 “延迟 "支付 或 者 不 朗 行 为 2.1 
2: 如 果 存 在 一 次 或 两 次 延迟 支付 或 不 良 行 为 
3; 如 果 有 超过 两 次 的 延迟 支付 行为 
4; 如 果 对 于 决策 存在 不 足 的 信用 史 
5: 如 果 存 在 超过 如 天 的 支付 不 良 行为 信用 史 
;如 果 存 在 超过 30 天 的 支付 不 良 行为 信用 中 
Mortgage credit score 1: 如 果 没 有 延迟 的 抵押 支付 行为 1.7 
2: 如 果 没 有 抠 押 支付 史记 录 
3: 如 果 有 一 次 或 西 次 延迟 的 抵押 支付 行为 
4: 如 果 存 在 超过 两 次 的 延迟 支付 行为 
Public bad credit record #m3 FEE fë HJiR[ EN 892 Fi E si , 代 管 行为 等 ) ， 0.074 
变量 值 为 1; 和 否则 为 0 
其 他 的 申请 者 特征 
Denied mortgage insurance 如 果 申 请 老 曾 申请 抵押 保险 且 被 拒绝 ,变量 值 为 1; 否 则 为 0 0.020 
Self-employed 如 果 自 我 就 业 ,变量 值 为 1; 否 则 为 0 0.116 
Single 如 果 申 请 者 是 单身 ,变量 值 为 1; 否 别 为 0 0.393 
High school diploma 如 果 申 请 者 高 中 毕业 ,变量 值 为 1; 否 则 为 0 0.984 
Unemployment rate 1989 年 马萨诸塞 州 申请 者 所 在 行业 中 的 失业 率 3.8 
Condominium 如 果 单 位 是 共管 的 ,变量 值 为 1; 否则 为 0 0.288 
Black 如 果 申 请 者 是 黑人 ,变量 值 为 1; 如 果 申 请 者 是 白人 则 为 0 0.142 
Deny 如 果 抵 押 贷 款 申 请 被 拒绝 ,变量 值 为 1; 否则 为 0 0.120 








变量 。 信 和 贷 员 通常 使 用 贷款 与 价值 比 的 门限 值 或 切割 值 , 所 以 该 变量 的 基准 设 定 使 用 贷款 
与 价值 比 是 高 的 ( 20.95) .中 等 的 (在 0.8 和 0.95 之 间 ) 还 是 低 的 ( <0.8; 为 了 避免 完全 多 
重 共 线 件 ,这 种 情况 被 省 略 了 }) 二 元 变量 。 前 三 列 中 的 回归 因子 与 波士顿 联邦 情 备 银行 在 
它们 最 初 对 这 些 数 据 的 分 析 中 所 考虑 的 基准 设 定 中 的 回归 因子 相似 ,2 第 (1) ~ 第 (3) 列 中 
的 回归 只 在 如 何 建 立 被 拒绝 概率 的 模型 上 有 所 不 同 ,它们 分 别 使 用 的 是 线性 概率 模型 logit 
模型 和 probit 模型 。 











# 9—2 使 有 波士顿 HMDA 数据 的 抵 择 贷款 被 拒绝 的 回归 模型 
因 变 量 ;如果 抵 挥 贷款 申请 被 拒绝 ,那么 deny =1; 理 则 ,deny =0;2 380 个 观测 值 




























































































同 妇 模型 LPM Logit Probit Probit Probit Probit 
UNIN £ (1) 【21 (3) (4) 15) (6) 
Black 0. 084°7 0.688%" D 389" 0.371** 0.363%" 0. 246 
(0.023) (0.182) (0.098) (0.099) (0.100) (0.448) 
PZ I rano 0.449" 4.76" ° 24" 24617 2.62" * 2.57 ` 
(0114) (1.33) (0.61) (0.60) _ (0.561) (0.66) 
Housing expense-to-uneome raito -0.048 -D.H - 0.18 _- 0. 30 -0. 50 -0.54 
(0.110) 1.29} (0.68) (0. 68) (0.70) (0. 74) 
Medium loan-to-value ratto 0.031 * 0.46" 0.21 022% 0.22" ° 0.22 
(Ü 8)=loan-nalue rato 0. 955 (0.013) (0.16) (0.08) (0. 08) (0.08) (0. 08) 
High loan-to-value ratto 0.189" 1.49*' 0.79** 0.79%" 0.847 0.797? 
(loan-value rato =0. 95) (0.050) (0.32) (0.18) (0.18) (9.18) (O. 18) 
Consumer eredi! score 00311 ° 0297: 0.15 ” 0.16 * ° 0. 34" ° 0.16 
(0.005) (0.04) (0. 025 (0.02) (0.11) (0.02) 
Mortgage credit score 0.021 0.28" 0.15” 0.11 0.16 0.11 
(0.011) (0.14) (0.07) (0.08) (0.10) (0.08) 
Publu: bad credit record 0. 19777 1.23 0.70" 0.70%" 0.72" 0.70" 
(0.035) (0.20) (0. 12) (0.12) (0.12) (0. 125 
Denied mortgage insurance 0.702" 4.55%? 2.567" 2.59% 2.59" 2.59" * 
(0.045) (0.57) _ (0.30) (0.29) (0.30) (0. 29) 
Self-employed 0.060 "° 0.677 0,36%" 0.35% 0.34" ° 0.35 ° 
(0.021) (0.21) (0.11) (0.11) (0.11) (0.11) 
Single 0.23" 0.23" 0.23" 
(008) — (0.08) (0.08) 
High school diploma -0 61" -和 的 — (). 62 °“ * 
(0.23) (0.24) (0.23) 
Unemployment raie 0. 03 0.03 0.03 
(0.02) (0.02) (0.02) 
Condomimum -0.05 
(0.09) 
Black x P/T ratio - 0. 58 
(1.47) 
Blaek x housing expense-to-income 1.23 
ratio (1.69) 
其 他 的 信用 等 级 指示 变 基 F T T E 是 否 
Constant -0.183 -5.717 -3.04 -257% -a90 -2.54"' 
(0.028) (0.48) (0.23) (0.34) (0.395 (0.35) 
AE BsEte#HB9 F ERTH P [8 d) (2) 3 O) (5) (6) 
Applicant single; HS diploma; 5.85 5.22 5.79 
industry unemployment rate { <0.001) (0001 ( <0-001) 
Additional credit raung 1.22 
indicator variables (0.291) 
Race wteractions and black 4. 96 
(0.002) 
Race interaction only 0.27 
(0. 766) 
白人 申请 者 和 黑人 申请 者 被 拒绝 的 8.4% 6. 0% 7.1% 6.6% 6.3% 6, $% 
ANMEZECRILA) 





注 :这 些 回归 是 使 用 附录 站 1 PARAE HMDA 数据 集中 的 n=2 380 个 观测 值 估计 的 。 线 性 
概率 模型 用 OLS 估计 ,而 probu 和 logi 回归 用 极 大 似 然 法 估计 。 标 准 误 在 系数 下 面 的 括号 中 给 出 ,P EE 
严 统计 量 下 面 的 括号 中 给 出 。 最 后 一 行 中 的 预测 概率 的 变化 ,是 针对 除 种 族 困 素 外 回归 因子 的 值 都 等 于 
样本 均值 的 这 样 一 个 假想 申请 者 而 计算 的 。 个 别 系数 在 "3 名 或 ”1 名 的 显著 性 水 平 下 在 统计 上 是 显 
EH- 


上 巧 联合 地 显著 的 ,因此 种 族 仍旧 有 显著 的 影响 。 此 外 ,所 估计 的 被 拒绝 概率 的 种 族 差 异 
(6.5% ) 实 质 上 与 其 他 probit 回归 中 的 结果 是 相同 的 。 

在 所 有 56 个 设 定 中 ,如 果 保 持 申 请 者 的 其 他 特征 不 变 , 那 么 种 族 因 素 对 被 拒绝 概率 的 影 
响 在 1 驼 的 水 平 下 在 统计 上 是 显著 的 。 黑 人 申请 者 和 白人 电 请 者 之 间 被 拒绝 概率 的 估计 善 
异 在 6.0 个 百分点 到 8. 4 个 百分点 之 间 变 动 。 

了 解 评价 这 个 差异 是 大 还 是 小 的 方法 ,需要 回 到 本 章 开关 所 提出 的 那个 问题 的 一 个 变 
FL. 假设 有 两 个 抵押 贷款 的 申请 个 人 ;一 个 白人 和 一 个 黑人 ,但 是 在 回归 (3) 中 的 其 他 自 
变量 却 有 相同 的 值 。 上 有 具体 来 说 ,除了 种 族 因 素 之 外 ,回归 (3) 中 其 他 自 变 量 的 值 者 是 HMDA 
数据 集合 中 的 样本 平均 值 。 白 人 申请 者 面临 闭 7. 45 的 被 拒绝 的 可 能 性 ,但 黑人 人 扎 请 者 则 
面临 着 14. 5 名 的 被 拒绝 的 可 能 性 。 所 合计 的 被 拒绝 概率 的 种 族 差异 为 7.1 个 百分点 ,这 意 
味 着 黑人 申请 者 被 拒绝 的 可 能 性 几乎 是 白人 申请 者 的 2 倍 。 

表 9 一 2 中 (以 及 波士顿 联邦 调查 署 最 初 的 研究 ) 的 结果 ,提供 了 抵押 贷款 被 拒绝 在 种 
族 差异 上 的 统计 证 据 , 按 照 法 律 这 是 不 应 该 存在 的 。 这 个 证 据 在 督促 银行 监管 者 做 出 政策 
变化 方面 起 了 重要 作用 ,中 但 是 经 济 学 家 喜欢 有 益 的 争论 ,这 些 结论 世 会 引发 激烈 的 争论 ， 
这 不 足 为 奇 。 

由 于 在 借贷 方面 存在 种 族 歧 视 的 提议 被 指控 ,因此 我 们 简短 地 回顾 一 下 这 个 争论 的 一 
些 论点 。 为 此 ,采用 第 7 章 提出 的 框架 结构 是 很 有 用 的 ,也 就 是 说 ,考虑 表 9 一 2 中 结果 的 内 
部 有 效 性 和 外 部 有 效 性 ,这 是 前 面 波士顿 HMDA 数据 分 析 的 代表 。 由 许多 对 波士顿 联邦 储 
备 银行 最 初 的 研究 所 构成 的 批判 锥 及 内 部 有 效 性 :数据 中 可 能 的 误差 ,不 同 的 非 线 性 函数 形 
式 ,额外 的 交互 作用 等 等 。 通 过 对 原始 数据 的 仔 岗 审 察 , 发现 了 一 些 错误 ,而 这 里 所 给 出 的 
结果 ( 和 波士顿 联邦 调查 署 最 终 公 布 的 研究 ) 都 是 以 “清洁 过 的 "数据 集 为 基础 的 。 其 他 设 
定 的 估计 一 一 不 同 函 数 形 式 和 /或 额外 的 回归 因子 一 一 也 得 到 了 与 表 9- 一 2 中 的 那些 结果 可 
比较 的 种 族 差 异 的 估计 值 。 关 于 内 部 有 效 性 的 一 个 潜在 的 更 难 的 问题 是 ,在 个 人 贷款 面 对 
面 会 谈 期 间 是 否 能 够 得 到 重要 的 非 种 族 方面 的 财务 信息 ,而 这 些 信 息 没有 在 贷款 申请 过 程 
中 被 记录 下 来 ,而 又 与 种 族 因素 相关 ,如 果 是 这 样 的 话 ,在 家 9 一 2 的 回归 中 仍然 有 可 能 存在 
遗漏 变量 偏差 。 最 后 ,有 人 对 外 部 有 效 性 提出 了 质疑 :即使 1990 年 在 波士顿 存在 种 族 歧视 ， 
由 此 有 暗含 着 当 令 其 他 地 方 的 沉 款 人 中 存在 种 族 羡 视 也 是 错误 的 。 解 决 外 部 有 效 性 问题 的 惟 
一 方法 就 是 考虑 取 自 其 他 地 方 和 年 份 的 数据 。@ 








[9. 5 _ 结论 ] 


当 内 变量 是 二 元 变量 时 ,总 体 回归 函数 就 是 以 回归 因子 为 条 件 当 了 = 1 时 的 概率 。 对 这 
个 总 体 回归 函数 的 估计 需要 找到 对 其 概率 解释 向 出 公正 评价 的 函数 形式 ,估计 那个 函数 的 
未 知 参数 ,并 解释 结果 ,所 得 出 的 预测 值 就 是 预测 概率 , 某 个 回归 因子 X 的 变化 的 估计 效应 
就 是 由 的 变化 所 引起 的 当 Y=1 时 的 概率 变化 。 

给 定 回归 因子 ,建立 了 = ! 的 概率 模型 的 一 个 很 自然 的 方法 是 使 用 累积 分 布 函 数 ,其 中 ， 
累积 分 布 函 数 的 变量 依赖 于 回归 因子 。probit 画 归 使 用 正 态 昧 积分 布 函 数 作为 回归 函数 ， 
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而 logit 回归 使 用 logistic 累积 分 布 画 数 作 为 回归 函数 。 由 于 这 些 模型 是 未 知 参 数 的 非 线性 
图 数 ,因此 估计 这 些 参 数 要 比 佑 计 线性 回归 系数 复杂 得 多 。 标 准 的 估计 方法 是 极 大 似 然 法 。 
在 实际 中 ,使 用 极 大 似 然 估计 的 统计 推断 与 多 元 线性 回归 中 统计 推断 的 方法 相同 。 例 如 , 系 
数 的 95 免 的 置信 区 间 被 构造 为 估计 系数 的 = 1. 96 倍 的 标准 误 。 


一 般 兴 趣 框 


诺 贝 尔 经 济 学 奖 获 得 者 James J. Heckman 和 Daniel L McFadden 

2000 年 度 诺 册 尔 经 济 学 疾 被 同时 授予 了 两 位 经 济 计量 学 家 ,区 加 天 大学 的 James J. 
Heckman 和 加利福尼亚 大 学 柏 克 葬 分 校 的 Daniel L. McFadden ,因为 他 们 对 个 人 和 企业 数据 
分 析 所 做 出 的 基础 性 贡献 。 他 们 的 大 部 分 工作 解决 了 因 受 限 因 变量 而 产生 的 困难 。 

Heckman 因为 发 展 了 处 理 样本 选择 的 工具 而 被 授予 诺 贝 尔 经 济 学 奖 。 如 同 7.2 节 中 所 
讨论 的 , 当 数 据 的 可 获得 性 受到 与 因 变 量 的 值 有 关 的 选择 过 程 影响 时 ,样本 选择 偏差 就 会 出 
现 。 例 如 ,假设 你 想 使 用 一 个 取 自 总 体 的 随机 样本 痰 估计 收入 和 和 一些 回 归 因 子 革 之 间 的 关 
系 。 如 果 你 使 用 已 就 业 工 人 一 一 即 那些 报告 了 正 收 人 的 工人 一 一 的 子 样本 佑 计 回归 ,那么 
OLS 估计 值 可 能 受 选择 偏差 影响 。Heckman 的 解决 方法 就 是 设 定 一 个 含有 指明 工人 是 否 在 
劳动 力 队 伍 中 (是 否 在 子 样本 中 ) 的 二 元 因 蛮 量 的 初始 方程 ,并 把 这 个 方程 和 收入 方程 看 做 
是 一 个 联 立方 程 组 。 这 个 一 般 性 的 策略 已 被 推广 到 许 名 领 域 中 出 更 的 选择 问题 上 ,其 范围 
从 劳动 经 济 学 ,到 产业 组 织 学 ,再 到 金融 学 。 

McFadden 因为 发 展 了 分 析 敲 散 选 择 数 据 的 模型 (一 个 高 中 毕业 生 是 参军 .上 大 学 还 是 
工作 ?) 而 被 授予 这 个 奖 。 他 是 从 一 个 人 使 其 每 种 可 能 选择 的 期 望 获 用 最 大 化 这 一 问题 出 
发 进行 考虑 的 ,每 种 可 能 选择 依赖 于 可 观测 的 变量 { 如 工资 .工作 特征 和 守 兰 背景 )。 然 后 ， 
他 有 导出 了 含有 未 知 系数 的 个 体 选 择 概率 襟 型 , 反 过 来 这 些 模型 可 以 使 用 极 大 似 然 法 进行 佑 
计 。 在 许多 领域 中 ,包括 劳动 经 济 学 卫生 经 济 学 以 及 运输 经 济 学 领域 ,这 些 模 型 及 其 推广 
已 被 证 明 在 分 析 离 散 选择 数据 上 是 非常 有 用 的 。 

要 想 获 得 关于 他 们 或 者 其 他 庄 贝 尔 经 济 学 奖 获得 者 的 更 多 信息 ,请 访问 诺 贝尔 基金 会 
网 站 :www. nobel. se/economics。 

尽管 存在 内 在 的 非 线性 特征 ,但 有 时 总 体 回 归 范 数 能 被 线性 概率 模型 即 多 元 线性 回归 
所 生成 的 直线 充分 地 通 近 。 线 性 概率 模型 .probit 回归 模型 以 及 logit 回归 模型 ,被 应 用 于 波 
+ HMDA 数据 中 时 ,都 给 出 了 相似 的 “底线 "答案 :所 有 的 三 个 方法 都 估计 出 了 (在 其 他 
条 人 都 类 似 的 情况 下 ) 黑人 申请 者 和 白人 申请 者 在 抵押 贷款 申请 被 拒绝 率 上 的 实质 性 
差异 。 

二 元 困 变 量 是 最 普通 的 受 限 因 变 量 的 例子 , 受 限 因 变 量 是 指 具 有 有 限 范围 的 因 变 量 。 
20 世纪 最 后 的 25 年 ,在 分 析 其 他 受 限 因 变 量 的 经 济 计量 方法 方面 到 得 了 重要 的 进展 ( 见 本 
章 一 般 兴 趣 框 ) ,附录 9.3 中 回顾 了 当中 的 一 些 方 法 。 








[总 结 


L 当 了 是 二 元 变量 时 ,多 元 线性 回归 模型 被 称 为 线性 概率 模型 。 总 体 回归 线 表示 给 定 
回归 因子 万 X, A 的 值 的 条 件 下 了 =1 的 概率 。 

2. probit 模型 和 logit 模型 都 是 当 了 是 二 元 变量 时 所 使 用 的 非 线 性 回归 模型 。 不 像 线 性 
概率 模型 ,probit 回归 和 logit 回归 可 以 确保 对 于 所 有 的 了 什 当 了 =1 时 其 预测 概率 在 0 和 1 





之 间 。 

3. probit 回归 使 用 标准 正 态 累 积分 布 函 数 。logit 回归 使 用 logistic 累积 分 布 函数 。logit 
和 probit 的 系数 使 用 极 大 似 然 革 进行 估计 。 

4. probit 回归 和 logit 同 归 中 的 系数 值 不 容易 解释 。 与 一 个 或 者 多 个 变量 的 变化 相 联 
系 的 Y=1 的 概率 的 变化 ,可 以 使 用 重要 概念 6. 1 中 列 出 的 非 线 性 模型 的 一 般 方法 进行 
计算 。 

5. 在 线性 概率 模型 logit 模型 以 及 probit 模型 中 ,系数 的 假设 检验 可 以 使 用 通常 的 : 统 
计量 和 下 统计 量 来 进行 。 


[重要 术语 


受 限 因 变量 ”线性 概率 模型 ”probit 概率 单位 模型 》 logit( 对 数 单位 模型 ) 非 线性 
最 小 二 乘 估计 量 ” 似 然 画 数 ” 极 大 做 然 估 计量 (MLE) ”被 正确 地 预测 的 比率 h R 


[复习 概念 ] 


9.1 假设 一 个 线性 概率 模型 生成 一 个 等 于 1.3 网 了 的 预测 值 ,请 说 明 为 什么 这 个 值 是 
没有 意义 的 。 

9.2 ERI 中 ,第 (1) 列 中 关于 black 的 估计 系数 是 0.084, 第 (2) 列 中 是 0.688 ,第 
《3) 列 中 是 0.389。 尽 管 有 这 么 大 的 差别 ,但 是 3 个 模型 都 得 出 了 种 族 对 抵押 贷款 被 拒绝 概 
率 的 边际 效应 的 相似 估计 值 ,为 什么 会 是 这 样 呢 ? 

9.3 你 的 一 个 朋友 正 考 虑 使 用 个 人 数据 来 研究 你 们 学 校 吸烟 的 决定 性 因素 。 她 问 你 ， 
她 是 该 使 用 probit 模型 logit 模型 还 是 线性 概率 模型 。 你 会 给 她 什么 建议 ? 为 什么 ? 

9.4 为 什么 使 用 极 大 伺 然 法 而 不 是 OLS 法 来 估计 probit 模型 和 logit 模型 的 系数 ? 





“9.1 使 用 公式 (9.8) 中 所 估计 的 probit 模型 回答 下 列 问 题 : 

a 一 个 黑人 抵押 贷款 申请 者 的 PI ratio 值 是 0.35, 他 的 申请 被 拒绝 的 概率 是 多 少 ? 

b. 假设 该 申请 者 将 这 个 比率 减 小 到 0. 30 ,这 会 对 他 的 抵押 贷款 被 拒绝 的 概率 有 什么 
影响 ? 

ce， 如果 该 申请 者 是 一 个 白人 ,请 重新 回答 {a) 和 (3D) 中 的 问题 。 

d. P/I ratio 对 抵押 贷款 被 拒绝 概率 的 边际 效应 是 特 依 赖 于 种 族 因素 ? 请 解释 说 明 。 

9 2 使 用 公式 {9.10) 中 的 logit 模型 重新 回 等 问题 9 1。logi 和 probit 的 结果 是 合 相 
似 ? 请 解释 说 明 。 

9.3 考虑 下 列 线性 概率 模型 :了 =A, +B.X, tu, JP P(Y, =11X,) =B, +B, X,, 

a 证 明 ,E{w lX ) =0。 

b. DFHB:var(u,lX,) = (B, +B,X.) U - (A, +B X.) ] (提示: 复习 公式 (2.7)) 

c u ATER? 请 解释 说 明 。 

d (复习 9.3 节 ) 推 导 似 然 函数 。 

9.4 ”利用 表 9~2 中 第 (1) 列 所 估计 的 线性 概率 模型 回答 下 列 问题 : 


p. 





a. 有 两 个 申请 者 :一 个 黑人 和 一 个 白人 ,同时 申请 一 项 抵押 贷款 。 除 了 种 族 因素 之 外 ， 
对 其 他 所 有 回归 因子 的 值 都 相同 。 对 于 黑人 中 请 者 米 说 ,他 的 抵押 贷款 的 申请 被 拒绝 的 可 
能 性 比 白人 中 请 者 会 大 多 少 ? 

b. 斌 (a) 中 的 答案 ,构造 5 免 的 置信 区 间 。 

e. 考虑 一 个 可 能 会 使 (a) 中 的 答案 产生 偏差 的 重要 遗 举 变 量 。 它 会 是 什么 呢 ? 它 是 如 
何 使 结果 产生 偏差 的 ? 

9.5 (需要 9.3 节 的 内 容 和 微 积分 的 知识 ) 假 设 一 个 随机 变量 了 具有 如 下 的 概率 分 
人 :Pr 了 =1) =p, PAY=2) = 和 而立 了 =3)=1-pP-4。 从 这 个 分 布 中 抽取 容量 为 的 一 
个 随机 样本 .随机 变量 用 Y ,Y. Y, 表示 。 

a. 推导 参数 疡 和 9 的 似 然 函数 。 

b. MES p 和 4g 的 MLE 公式 。 


[附录 9.1 波士顿 HMDA 数据 集 - 


波士顿 HMDA 数据 集 是 由 波士顿 联邦 储备 银行 的 研究 人 员 搜 集 的 。 该 数据 集合 并 了 
抵 祁 贷款 申请 的 信息 以 及 收 到 这 些 抵押 贷款 申请 的 银行 与 其 他 贷款 机 构 的 追踪 调查 信息 。 
该 数据 涉及 波士顿 大 区 在 1990 年 的 抵押 贷款 申请 。 完 全 的 数据 集 共 有 2 925 个 观测 值 ,由 
黑人 和 西班牙 人 的 所 有 抵押 贷款 申请 加 上 一 个 白人 抵押 贷款 申请 的 伍 机 样本 所 梅 成 。 

为 了 缩小 本 章 分 析 的 范围 ,我 们 使 用 只 有 一 个 住房 的 家 庭 ( 因 此 ,排除 了 多 个 住房 的 家 
庭 的 数据 ) ,并 且 只 针对 黑人 申请 者 和 白人 申请 者 (这 样 ,也 排除 了 其 他 少数 民族 群体 的 数 
据 ) 的 数据 的 子 集 , 这 样 就 只 剩 下 了 2 380 个 观测 值 。 表 9 一 1 给 出 了 本 章 中 所 使 用 的 变量 
的 定义 。 

很 感谢 波士顿 联邦 储备 银行 研究 部 的 Geoftrey Tootel 向 我 们 提供 了 这 些 数据 。 关 于 这 
个 数据 集 的 更 多 信息 ,连同 波士顿 联邦 储备 银行 研究 人 员 所 得 出 的 结论 一 起 , 在 Alicia H. 
Munnell ,Geoffrey M, B. Tooteli, Lynne E. Browne 与 James MeEneaney 等 的 论文 " Morigage 
Lending in Boston ; Interpreting HMDA Data” ( American Economie Review , 1996 , pp. 25 - 53 ) 中 
可 找到 。 





[附录 9.2_ 极 大 似 然 估计 


本 附录 提供 了 与 本 童 中 所 讨论 的 二 元 响应 模型 的 内 容 有 关 的 极 大 似 然 估计 的 简要 介 
绍 。 我 们 从 推导 个 独立 同 分 布 的 贝 努 里 随机 变量 观察 值 的 成 功 概率 p 的 MLE 开始 。 然 
后 ,我 们 转向 probit 模型 和 logit 模型 ,并 讨论 伪 下 。 我 们 以 预测 概率 的 标准 误 的 讨论 作为 
结束 。 本 附录 使 用 阅 点 积分 。 
个 iid. 贝 努 里 随机 变量 的 MLE 

计算 MLE 的 第 一 步 是 推导 联合 概率 分 布 。 对 S i i d. 的 贝 努 里 随机 变量 观测 值 而 
言 , 这 个 联合 概率 分 布 是 9. 3 节 中 n=2 的 情形 到 一 般 的 n 的 扩展 : 

Pr 了 =y Y, Syet Yn EY) 


={p Op) x [P21 =p)" ] s [pr (lp ] 
= tgl -put th? (9. 13) 











伺 然 哆 数 就 是 该 联合 概率 分 布 ,被 看 做 未 知 系数 的 函数 。 息 设 3 = 之 Y, , BZ MA 8 
数 就 是 ; 
Siom (PSY Ya ) =p (1 -py (9.14) 
p 的 MLE 就 是 使 公式 (9.14) 中 的 似 然 函数 最 大 的 p 值 ,可 以 使 用 微 积分 方法 求 似 然 服 
数 的 最 大 值 , 求 似 然 函数 对 数 的 最 大 值 ,而 不 直接 求 似 然 函 数 的 最 大 值 ,这 要 简便 得 多 ( 因 
为 对 数 是 严格 的 增 孙 数 ,所 以 使 似 然 函数 或 者 它 的 对 数 最 大 化 会 得 出 相同 的 估计 量 )。 对 
数 似 然 函数 就 是 SIn{p) + (n ~5)ln(1 一 p) ,而 县 对 数 似 热 函 数 关 于 2 的 导数 是 ; 


d S n-5 
qp /ema (pi Y s. Y.)] =P 1-p (9. 15) 
设 公式 (9. 15) 中 的 导数 为 0, 求 解 p 得 出 MLE) = Sn =Y, 


probit 模型 的 MLE 
对 于 probit 模型 ,以 X, Åy, re A NRY =1 时 的 概率 是 p, =@(B, +p X,, 十 +B,X, Jo 
第 i 个 观测 值 的 条 件 概率 分 布 就 是 Pr(Y =y, IX. X.) Ep -p e RRE AX Y) 
iid 的 i=1,2,…,n, 那 么 以 变量 和 为 条 件 ,了 7, ,…, 了 的 联合 概率 分 布 是 ; 
Pr( Y, = 入 
=Pr( Yi = 和 | x Pr( Y =y, Xino t An) 
spl -pT x. pl =p) (9.16) 
似 然 函数 就 是 该 联合 概率 分 布 ,被 看 做 未 知 系数 的 函数 。 考 虑 似 然 范 数 的 对 数 会 简便 
一 些 , 因 此 ,对 数 似 然 函数 是 : 
nf Bo 8 Yi. Y IX... Aail end] 
= Y Fla OB tN + +8X)] + 


> (1-Y)In[l~ BB, +B X, + +B,X,)] (9. 17) 

其 中 ,该 表达 式 涵盖 了 probu 的 条 件 概率 公式 :P =P +B X. +" +B,X,). 
probit 模型 的 MLE 使 似 然 函 数 最 大 化 ,或 者 说 ,使 公式 (9.17) 中 所 给 出 的 对 数 似 然 函 
数 最 大 化 。 由 于 没有 简单 公式 计算 MLE ,因此 probit 似 然 函 数 必须 使 用 数值 算法 在 计算 机 


上 实现 最 大 化 。 
在 一 般 条 件 下 , 极 大 似 然 估 计量 是 一 致 的 ,而 且 在 大 样本 条 件 下 有 正 态 的 抽样 分 布 。 


logit 模型 的 MLE 

logit 模型 的 似 然 函数 可 按照 与 probit 模型 的 似 然 函 数 相同 的 方法 进行 推导 ,惟一 的 差 
别 就 是 logit 模型 的 条 件 成 功 概率 p, 由 公式 (9.9) 给 出 。 因 此 ,logit 模型 的 对 数 似 然 函 数 由 
公式 {9.17) 给 出 ,用 [1 + 中 tP -RE (B, + BX, + +BX.)], R 
probit 模型 一 样 ,ljogit 系数 的 MLE 也 没有 简单 的 计算 公式 ,因此 其 对 数 似 然 函 数 也 必须 用 数 
值 代数 方法 进行 最 大 化 。 
f R 

E R! 把 估计 模型 的 似 然 函 数 的 值 和 没有 变量 作为 回归 因子 时 的 似 然 函数 的 值 做 比 
较 。 具 体 来 说 , 念 到 HEE: 








的 是 Y=0, 而 不 是 说 。 

当 公 式 (9.21) 使 用 观测 到 的 支出 了 并 在 了 ”进行 估计 时 ,所 得 出 的 OL 佑 计量 是 不 一 
致 的 。Tobin 通过 使 用 服从 正 态 分 布 的 这 一 额外 假设 来 推 时 相应 的 似 然 函 数 ,从 而 解决 
了 这 个 问题 ,所 得 出 的 MLE 被 应 用 经 济 计量 学 家 用 于 分 析 经 济 中 的 许多 问题 。 为 了 纪念 
Tobin, 公 式 (9. 21) 与 正 态 误差 假设 一 起 被 称 为 tobit 回归 模型 。tobit 模型 是 删 剪 的 回归 模 
Æ { censored regression model] 的 一 个 例子 ,之 所 以 称 其 是 圳 剪 的 ,是 因为 因 变 其 在 某 个 切 
割 点 之 上 或 之 下 的 值 已 被 删 前 掉 。 


样本 选择 模型 


在 删 前 的 回归 模型 中 ,有 关于 购买 者 和 非 购买 者 的 数据 , 从 成 人 总 体 的 简单 随机 抽样 中 
获得 的 数据 就 是 这 样 。 然 而 ,如 果 从 销售 税 记录 方面 搜集 数据 ,那么 数据 将 只 包含 购买 者 ， 
根本 不 会 有 非 购买 者 的 数据 。 在 某 一 个 门限 值 之 上 或 者 之 下 不 可 获得 的 观测 值 数据 (只 限 
于 购买 者 的 数据 ) 被 称 为 截 尾数 据 。 截 尾 回 归 寞 型 {truncated regression model) 是 应 用 于 
因 变 量 在 某 个 团 割 点 之 上 或 者 之 下 时 数据 的 观测 值得 不 到 的 数据 中 的 一 种 回归 模型 。 

截 尾 回 归 模 型 是 样本 选择 模型 的 一 个 例子 ,在 样本 选择 模型 中 ,选择 机 制 { 个 人 由 于 买 
车 而 包含 在 样本 中 ) 与 因 变 量 的 值 (汽车 的 价格 ) 有 关系 。 如 9 5 节 的 一 般 兴 趣 框 中 所 讨论 
的 那样 ,估计 样本 选择 模型 的 一 种 方法 就 是 设计 两 个 方程 :一 个 是 Y” 的 方程 ,一 个 是 不 论 
Y° 是 否 被 观测 到 的 方程 。 然 后 模型 的 参数 可 以 用 极 大 似 然 法 进行 估计 ,或 者 在 一 个 连 步 法 
的 程序 中 ,首先 估计 选择 方程 ,然后 估计 Y: 方程。 进一步 的 讨论 ,请 见 Ruud(2000 ,第 28 
章 ) 或 Greene(2000 ,第 20.4 节 })。 


计数 数据 


当 因 变 量 是 一 个 计数 的 数 时 ,例如 一 个 消费 者 在 一 周 内 到 饭店 进餐 的 次 数 ,计数 数据 
(count data) 就 产生 了 。 当 这 些 数字 很 大 时 ,该 变量 可 被 看 做 是 近似 连续 的 ,但 是 当 这 些 数 
字 很 小 时 ,连续 近似 效果 很 差 。 用 OLS 估计 的 线性 回归 模型 可 被 用 于 计数 数据 ,即使 计数 
的 数 很 小 。 来 自 该 售 归 的 预测 值 , 可 被 解释 为 以 回归 因子 为 条 侍 的 因 变 量 的 期 望 值 。 因 此 ， 
当 因 变量 是 到 饭店 进餐 的 次 数 时 ,预测 值 1.7 的 意思 是 平均 每 周到 饭店 进餐 1. 7 次 。 不 过 ， 
就 像 在 二 元 回归 模型 中 一 样 ,OLS 没有 利用 计数 数据 的 特殊 结构 ,因此 得 到 的 是 无 意义 的 预 
测 值 ,例如 每 周到 饭店 进餐 次 数 为 -0.2。 正 如 当 因 变量 是 二 元 变量 时 ,probit 模型 和 logit 
模型 可 以 消除 无 意义 的 预测 一 样 , 对 于 计数 数据 ,特殊 模型 也 能 做 到 , 其 中 两 个 使 用 最 广泛 
的 模型 就 是 泊 松 和 笛 二 项 回 好 模型 ( Poisson and negative binomial regression model) 。 


有 序 的 响应 数据 


当 相互 排斥 的 定性 分 类 有 一 个 正常 的 顺序 时 , 俩 如 获得 一 个 高 中 学 历 . 某 种 程度 的 大 学 
教育 (但 没有 毕业 ) ,或 者 大 学 毕业 ,就 出 现 了 有 序 的 陶 应 数据 {ordered response data) 的 
现象 。 像 计数 数据 -一样 ,有 序 响应 数据 有 一 个 自然 的 顺序 ,但 是 与 计数 数据 义 不 同 ,有 序 的 
响应 数据 没有 自然 的 数值 。 

由 于 有 序 的 响应 数据 没有 自然 的 数值 ,所 以 OLS 是 不 适用 的 ,而 是 经 常 使 用 一 个 被 称 
为 有 序 probit 模型 ordered probit model) 的 probit 模型 的 推广 来 分 析 有 兰 数 据 , 在 这 个 模 
型 中 ,以 自 变量 (如 父母 的 收入 ) 为 条 性 的 每 个 结果 ( 如 大 学 教育 ) 的 概率 使 用 累积 正 态 分 布 
来 建立 模型 。 











离散 选择 数据 


离散 选择 { discrete choice) 变量 或 多 个 选择 (muitiple choice) 恋 量 可 以 到 多 个 无 序 的 
定性 值 。 经 济 学 中 一 个 例子 是 ,一 位 通勤 者 所 选择 的 交通 方式 可 能 是 乘 地 铁 , 坐 公交 车 , 自 
己 开 车 ,或 者 自己 支配 的 其 他 方式 (如 步行 , 骑 车 )。 如 果 我 们 要 分 析 这 些 选 择 , 那 么 因 变 量 
会 有 四 种 可 能 的 结果 ( 地铁, 公交 车 ,汽车 ,人 力 )。 无 论 以 何 种 自然 的 方式 排列 ,这 圭 结果 
都 不 是 有 序 的 。 相 反 ,这 些 结果 是 不 同 的 可 供 选 择 的 定性 方案 中 的 一 种 选择 。 

经 济 计量 学 的 任务 就 是 在 给 定 不 同 回归 因子 的 条 件 下 ,例如 个 体 特征 (通勤 者 住处 离 
地 铁 站 有 多 远 ) 和 每 个 选项 的 特征 { 地 铁 票 价 ) ,建立 选择 不 同 选 项 的 概率 模型 。 如 9.5 节 
的 一 般 兴 趣 框 中 所 讨论 的 ,离散 选择 数据 的 分 析 模 型 可 以 用 效用 最 大 化 原理 来 推导 。 个 体 
选择 概率 可 以 用 probit 模型 或 者 logit 模型 形式 来 表达 , 而 这 些 模型 被 称 为 多 项 probit 
( multinomial probit) 和 多 项 Iogitf multinomial logit} 回归 模型 。 








相关 性 叮 能 有 不 同 的 根源 ,包括 省 略 变量 ,变量 误差 { 回归 因子 中 的 测度 误差 ) ,或 联 立 因果 
关系 (这 时 的 因果 关系 既 从 了 到 二 即 " 向 后 "传导 ,也 从 王 到 了 即 “向 前 "传导 )}。 不 论 天 各 
4 之 间 的 相关 性 的 来 源 如 何 , 如 果 存 在 一 个 有 效 的 工具 变 景 Z ,那么 就 可 以 使 用 该 工具 变量 
的 估计 荤 来 估计 天 的 单位 变化 对 了 的 影响 。 


10. 1. 1 IV 模型 和 假设 


联系 因 变 量 Y 和 回归 因子 艺 的 总 体 回 归 模 型 是 
了 = +B +u, izl, en (10.1) 
和 和 通常 一 样 ,wu, 是 代表 决定 ERRAR yas. WE X, t u, 相关 ,那么 OL 估计 其 
就 是 个 一 臻 的。 工具 变 量 估计 使 用 一 个 额外 的 "工具 "变量 Z 32yFE B 5 u 无 闫 的 那 部 分 
下 的 变化 。 

内 站 性 和 外 牛 性 。 工具 变 起 回归 有 一 些 专门 的 术语 ,这 些 术 请 将 与 总 体 误 差 项 “上 相关 
的 变量 和 不 相关 的 变量 区 分 开 来 。 与 误差 项 相关 的 变量 被 称 为 内 生 {endogenous) 变 基 ， 
而 与 误差 项 无 关 的 变量 被 称 为 外 生 [exogenous ) 变 量 。 这 些 术语 的 历史 渊源 可 追溯 到 含有 
多 个 方程 的 模型 ,在 这 些 模 型 中 ,“ 内 生 " 变量 是 在 模型 内 部 块 定 的 ,而 “外 生 " 变量 是 在 模型 
外 部 决定 的 。 例 如 ,7. 2 节 考 虑 了 这 种 可 能 性 ,如果 由 于 政治 干预 和 增加 资助 导致 低 的 考试 
成 绩 会 引起 学 生 一 教师 比 的 下 降 ,那么 学 生 一 教师 比 和 考试 成 绩 之 间 就 互 为 因果 关系 。 在 
数学 上 ,这 可 被 表示 为 一 个 有 两 个 联 立 方程 公式 (7.3) 和 公式 (7.4) 的 系统 ,每 个 方程 对 应 
一 个 因果 关系 。 如 7.2 节 中 所 讨论 的 ,因为 考 斌 成绩 和 学 生 一 教师 比 都 是 在 模型 内 决定 的 ， 
所 以 它们 都 与 总 体 误差 项 上 相关 ,也 就 是 说 ,在 这 个 例 予 中 ,两 个 变量 都 是 内 生 的 。 相 反 ,在 
重型 外 部 决定 的 外 生变 量 与 无关。 

有 效 工具 变量 的 项 个 条 件 , 一 个 有 效 的 工具 变量 (“工具 ”) 必 须 满 足 黄 个 条 件 , 即 所 请 
的 工具 变量 相关 性 (instrument relevancej 和 工具 变量 外 生性 (instrument exogeneity ) : 

1 工具 变量 相关 性 :com(Z, ,X,) #0。 

2. 工具 变量 外 生性 ;econm(2,,u,) =0。 

如 果 一 个 工具 变量 是 相关 的 ,那么 该 工具 变量 的 变化 与 ,的 变化 相关 。 此 外 ,如 果 该 
工具 变量 是 外 生 的 ,那么 由 该 工具 变量 所 捕 提 到 的 的 那 部 分 变化 就 是 外 生 的 。 因 此 ,一 
个 相关 的 而 且 外 生 的 工具 变量 能 够 捕捉 蕊 的 外 生变 化 ,这 个 外 生变 化 反 过 来 能 被 用 来 估计 
总 体系 数 语 o 

对 于 工具 变量 回归 而 言 ,一 个 有 效 工 具 变量 的 这 两 个 条 件 是 至 关 重 要 的 ,在 整 章 中 我 们 
都 会 重复 这 两 个 条 件 ( 它们 对 允 个 回归 因子 和 多 个 工具 变量 的 情形 仍然 是 很 重要 的 ) 。 


10.1.2 两 阶段 最 小 二 乘 佑 计量 


如 果 工 具 变量 了 满足 工具 变量 相关 性 和 外 生性 的 条 件 ,那么 可 以 使 用 被 称 为 两 防 段 最 
J — 3 (two stage least squares ,简写 为 TSLS) 的 JI 估计 量 来 估计 系数 户 。 顾 各 思 尽 ,两 
阶段 最 小 二 胶 估 计量 是 按 两 个 阶段 计算 的 。 第 一 阶段 将 XY 分 解 成 两 部 分 :一 个 是 可 能 与 回 
妇 误 差 项 相关 的 有 问题 的 部 分 ; 另 一 个 是 与 回归 误差 项 无 关 的 没有 问题 的 部 分 。 第 二 阶段 
使 用 这 个 没有 问题 的 部 分 来 估计 局 。 
第 一 阶段 从 联系 开 和 了 的 总 体 回归 开始 : 
X. =m +mZ, +" (10.2) 


其 中 ,7 ERE, m, 是 斜率 ,wm 是 误差 项 。 这 个 回归 提供 了 我 们 对 艺 所 需要 的 分 解 。 一 部 














分 是 mo +712,, 它 是 可 以 被 Z. 预测 的 X 中 的 部 分 。 由 于 ZZ 是 外 生 的 ,因此 ,XX 中 的 这 个 部 
分 与 公式 (10. 1) 中 的 误差 项 u, BÉ. X 中 的 另 一 部 分 就 是 w , 它 是 与 上 相关 的 XX 中 有 问 
题 的 部 分 。 

TSLS 背后 的 思想 就 是 ,使 用 无 问题 的 艺 的 部 分 , 即 ro + 和 ri 忆 ,忽略 上 。 惟 一 的 复 娄 之 处 
就 是 ma 和 的 值 都 是 未 知 的 ,因此 不 能 计算 mm + 加 乙 。 所 以 ,TSLS 的 第 一 阶段 将 OLS 应 用 
于 公式 {10,2) ,并 且 使 用 OLS 回归 的 预测 值 色 = 元 + mZ, HEP, To 和 分 是 OLS 估计 值 。 

TSLS 的 第 二 阶段 很 容易 ,用 也 对 外 进行 OLS 回归 。 从 第 二 阶段 回归 中 得 出 的 相应 的 
估计 量 就 是 TSLS 佑 计量 , 即 房 革 sI AP. 


10.1.3 为 什么 IV 回归 会 起 作用 

对 于 为 什么 IV BARAT X, 和 之 间 的 相关 性 问题 ,下 面 两 个 例子 提供 了 EAR 
解释 。 

例 1: Philip Wright 的 问题 。 工具 变量 居 计 方法 最 早 发 表 在 1928 年 由 Philip G. Wright 
( Wright,1928) 所 编写 的 一 本 书 的 附录 中 ,但 是 人 们 认为 这 个 附录 是 他 的 儿子 Sewall 
和 Wright 一 一 一 个 重要 的 统计 学 家 所 写 的 ,或 者 是 他 俩 合 写 的 。Philip Wright 关心 他 那个 时 代 
的 一 个 重要 的 经 济 问题 :如 何 制定 动 植物 铀 和 油脂 的 进口 关税 (对 进口 商品 征收 的 一 种 
税 ) ,例如 黄油 和 豆油 。 在 20 世纪 20 年 代 , 进 口 关税 是 美国 税收 的 主要 来 源 。 理 解 关税 的 
经 济 效应 的 关键 就 是 要 有 对 该 商品 供求 曲线 的 定量 估计 值 。 回 想 一 下 ,供给 弹性 就 是 价格 
增加 1 名 所 引起 的 供给 量 的 百分比 变化 , 而 需求 弹性 就 是 价格 增加 19% 所 引起 的 需求 量 的 百 
分 比 变化 。Philip Wright 需要 的 就 是 这 些 供给 和 需求 弹性 的 估计 值 。 

为 了 使 问题 具体 化 ,考虑 估计 黄油 需求 弹性 的 问题 。 回 想 一 下 重要 概念 6. 2, 联 系 
In( 了 ) 和 jn(X,) 的 线性 方程 的 系数 ,其 含义 就 是 Y 关 于 X 的 弹性 。 在 Wnght 父子 的 问题 
中 ,意味 着 需求 方程 可 以 这 样 写 : 

(Q) =ñ, +B, n( phe) +u, (10.3) 
其 中 ,0 是 黄油 消费 量 的 第 i 个 观测 值 , Pr” 是 黄油 的 价格 ,x, 代表 影响 需求 的 其 他 因 
素 , 例 如 收入 和 消费 者 嗜好 。 在 公式 (10.3) 中 ,黄油 价格 每 增加 1% 就 会 引起 需求 量变 化 百 
分 之 局 ,因此 ,B 就 是 需求 弹性 。 

Wright 父子 拥有 1912 年 到 1922 年 美国 黄油 年 度 总 消费 量 及 其 年 度 平均 价格 的 数据 。 
通过 将 OLS 应 用 于 公式 (10. 3) ,将 会 很 容易 使 用 这 些 数据 来 估计 需求 弹性 ,但 是 他 们 有 个 
重要 的 看 法 , 即 由 于 供给 和 需求 之 间 的 相互 作用 ,回归 因子 In( Pr) 可 能 与 误差 项 相关 。 

为 了 和 弄 清 这 一 点 ,请 看 图 10 一 1(a)。 该 图 显示 了 三 个 不 同年 份 里 黄油 的 市 场 需求 和 供 
给 曲线 。 第 一 个 时 期 的 需求 和 供给 曲线 分 别 用 D, Tl S, 表示 ,而 第 一 个 时 期 的 均衡 价格 和 
均衡 数量 是 由 它们 的 交点 兢 定 的 。 在 第 二 年 ,需求 从 D. EJt#l D,t 比如 ,由 于 收入 的 增 
JH) ,而 供给 从 S, 下 降 到 S$,( 比 如 ,由 于 黄油 生产 成 本 的 上 升 ) ,均衡 价格 和 均衡 数量 是 由 新 
的 供给 和 需求 曲线 的 交点 决定 的 。 在 第 三 年 ,影响 需求 和 供给 的 因素 又 发 生 了 变化 ,需求 增 
加 到 D, ,供给 增加 到 5, ,并 决定 了 新 的 均衡 价格 和 均衡 数量 ， 图 10 一 1(b) 显 示 了 这 三 年 以 
及 接 下 来 八 年 的 均衡 数量 和 均衡 价格 对 ,其 中 在 每 一 年 里 ,供给 和 需求 曲线 都 受到 了 除 价格 
之 外 的 影响 市 场 供 给 和 需求 变化 的 因素 的 影响 。 这 个 散 点 图 就 像 Wright 父子 在 描绘 他们 
的 数据 时 所 看 到 的 散 点 图 一 样 。 就 如 他 们 所 推理 的 一 样 ,用 OLS 拟 合 这 些 点 的 直线 既 不 能 
估计 需求 曲线 ,也 不 能 估计 供给 曲线 ,因为 这 些 点 是 由 需求 和 供给 的 变化 共同 决定 的 。 





(a) 3 个 时 期 的 需求 和 供给 
广 : 价 格 和 数 基 是 由 供给 曲线 和 需求 昌 线 的 交点 决定 的 。 第 一 个 时 期 的 均衡 是 由 需求 曲线 D, 和 供 
给 曲线 S, 的 交点 决定 的 ,第 二 个 时 期 的 均衡 是 由 D, 和 5, 的 交点 决定 的 ,而 第 三 个 时 斯 的 均衡 是 由 D, 
和 5 的 交点 决定 的 。 





(b) 11 个 时 期 的 均衡 价格 和 均衡 数量 
注 :这 个 散 点 图 显示 了 11 个 不 同时 期 里 的 均衡 价格 和 均衡 数量 ,隐藏 了 需求 和 供给 曲线 。 你 能 够 
根据 这 个 散 点 图 中 的 点 确定 需求 和 供给 曲线 吗 ? 
价格 





数量 


(e) 在 只 有 供给 曲线 移动 时 的 均衡 价格 和 均衡 数量 
注 : 当 供 给 曲线 从 S, 移动 到 S, 再 到 S, 而 需求 曲线 保留 在 D, 时 ,均衡 价格 和 均衡 数量 沿 大 需求 申 
线 移动 。 
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Wrigh 父子 意识 到 ,处 理 这 个 问题 的 方法 就 是 要 找到 使 供给 曲线 移动 而 又 不 影响 需求 
曲线 变化 的 某 一 第 三 个 变量 。 图 10 一 1(c) 显 示 了 当 这 样 一 个 变量 使 供给 曲线 发 生 移动 ,但 
击 求 曲线 保持 不 变 时 的 情景 。 现 在 所 有 的 均衡 价格 和 数量 对 都 在 一 条 稳定 的 需求 曲线 上 ， 
并 且 这 条 需求 曲线 的 斜率 很 容易 被 估计 。 在 Wright 父子 问题 的 工具 变量 表达 式 中 ,第 三 个 
变量 一 -工具 变量 一 一 与 价格 相关 ( 它 使 供给 曲线 移动 ,这 导致 了 价格 的 变化 ) ,但 与 4 无 
关 ( 需 求 曲 线 保 持 稳定 不 变 ) 。Wright 父子 研究 了 几 个 可 能 的 工具 变量 ,其 中 一 个 是 天 气 。 
例如 ,奶牛 场地 区 低 于 平均 水 平 的 降雨 量 可 能 会 影响 牧草 生长 ,这 样 会 减少 给 定价 格 下 的 黄 
油 产量 ( 它 将 会 使 供给 曲线 向 左 移动 , 提高 均衡 价格 ) ,所 以 奶牛 场地 区 的 降雨 量 满足 工具 
变量 相关 性 这 一 条 件 , 但 是 奶牛 场地 区 的 降雨 量 不 应 该 对 黄油 的 需求 有 直接 影响 ,因此 , 奶 
和 牛 场地 区 降雨 量 与 u 之 间 的 相关 系数 将 会 是 0。 也 就 是 说 ,奶牛 场地 区 降 南 量 还 满足 工具 
变量 外 生性 这 一 条 件 。 

例 2: 悄 计 旗 级 规模 对 考试 成 绩 的 影响 。 尽 管控 制 了 学 生 和 地 区 特征 ,但 第 2 部 分 所 给 
出 的 班级 规模 对 考试 成 绩 影响 的 估计 值 , 仍 可 能 含有 由 不 可 测度 的 变量 ,例如 校外 学 习 机 会 
或 教师 质量 等 ,引起 遗漏 变量 偏差 。 如 果 得 不 到 这 些 变量 的 数据 ,那么 这 个 遗漏 变量 仿 差 就 
不 能 通过 在 多 元 回归 中 引 人 这 些 变量 来 解决 。 

工具 变量 回归 就 为 这 个 问题 提供 了 一 个 可 供 选 择 的 解决 方法 。 考 虑 下 面 的 假设 例子 ; 
夏天 由 于 地 震 ,加 利 福 尼 亚 州 的 一 些 学 校 被 迫 停 课 维 修 , 接 近 和 震中 的 地 区 受到 最 严重 的 影 
响 。 一 些 停课 的 地 区 必须 把 学 生 挤 在 一 起 ,临时 扩大 班级 规模 。 这 意 昧 着 与 震中 的 距离 洪 
足 工具 变量 相关 性 的 条 件 ,因为 它 与 班级 规模 相关 。 但 是 ,如 果 与 震中 工 离 不 与 任何 影响 学 
生成 绩 的 其 他 因素 相关 (例如 ,学 生 是 否 仍然 学 英语 ) ,那么 它 将 是 外 生 的 ,因为 它 与 误差 项 
不 相关 。 因 而 ,到 震中 的 距离 这 个 工具 变量 ,就 可 以 被 用 来 防止 遗漏 变量 偏差 的 发 生 和 估计 
班级 规模 对 考试 成绩 的 影响 。 


10. 1.4 TSLS 佑 计量 的 抽样 分 布 


在 小 样本 中 ,TSLS 估计 量 的 精确 分 布 很 复杂 。 不 过 , 像 OLS 估计 量 一 样 ,在 大 样本 条 件 
下 它 的 分 布 是 简单 的 :TSLS 估计 量 是 一 致 的 且 服 从 正 态 分 布 。 

TSLS 估计 量 的 公式 BA TSL 的 两 个 阶段 使 估计 量 看 上 去 显得 复杂 ,但 是 ,如 果 只 有 
一 个 天 和 一 个 工具 变量 2 时 (如 本 节 我 们 所 假设 的 ) ,TSLS 估计 量 的 公式 就 很 简单 。 假 设 
sp Z 和 了 之 间 的 样本 协 方 差 ,假设 so 是 Z 和 XX 之 则 的 样本 协 方 差 , 如 附录 10.2 所 示 , 会 
单个 工具 变量 的 TSLS 估计 量 是 ， 





pm = 2 (10.4) 


也 就 是 说 ,B 的 TSLS 估计 量 就 是 2 和 了 之 间 的 样本 协 方 差 与 和 了 之 间 的 拌 本 协 方 差 
之 比 。 

当 样本 容量 很 大 时 ,Brss 的 抽样 分 布 。 公 式 (10.4) 可 被 用 来 证 明 Pr” 是 一 致 的 ,而 且 
在 大 样本 条 件 下 服从 正 态 分 布 。 这 里 只 是 把 争论 要 点 总 结 一 下 ,而 数学 细节 则 在 附录 10.3 
中 给 出 。 

ES 是 一 致 的 这 一 论点 ,把 Z, 是 相关 的 和 外 生 的 假设 同样 本 协 方差 和 总 体 协 方差 相 一 
致 这 个 结论 结合 起 来 了 。 因 为 在 公式 (10. 1) 中 了 =p +8, X, +u, PTE: 

cov(Z ,Y.) =eor( ZB +B. X. +u.) =Bicov( Z, ,A,) +eov(Z,,u,) (10.5) 

其 中 ,第 二 个 等 式 是 根据 协 方 差 的 性 质 (公式 (2. 33) ) 得 到 的 。 根 据 工具 变量 外 生性 假设 ， 


cov(Z,,u,)】=0, 而 根据 工具 变量 相关 性 假设 ,cov (2Z,,X,) 关 0。 因 而 ,如 果 工 具 变量 是 有 效 


的 ,那么 : 
_ co (Z,,Y ) 
' eot Z, X) 


这 就 是 说 ,总 体系 数 B 就 是 Z 和 了 之 间 的 总 体 协 方差 与 和 X 之 间 的 总 体 协 方差 之 比 。 
如 3.6 节 中 所 讨论 的 ,样本 协 方差 是 总 体 协 方差 的 一 致 全 计量 ,也 就 是 说 ,spy 一 >cov 


(ZY) sax 一 wcov(2., 时 )。 由 公式 (10.4) 和 公式 (10.6) 得 出 的 TSLS 估计 量 是 一 致 的 : 
am * P cov(Z ,Y.) 

B. C C G (Z X) A 

公式 (10.4) 也 能 被 用 来 证 明 在 大 样本 条 件 下 A 的 抽样 分 布 是 正 态 分 布 ,理由 与 我 

们 已 考虑 过 的 其 他 每 一 个 最 小 二 乘 估计 量 相同 :TSLS 估计 量 是 随机 变量 的 一 个 平均 值 ,而 

在 样本 规模 很 大 时 ,中 心 极限 定理 告诉 我 们 ,随机 变量 的 平均 值 服从 正 态 分 布 。 具 体 来 说 ， 


公式 (10.4) 中 的 ms 表达 式 的 分 子 sz = -了 (Z, -Z) (Y, - YR(Z, -Z) (Y, -DH 
一 个 平均 值 。 在 附录 10.3 中 所 介绍 的 有 关 代数 知识 表明 ,由 于 求 这 个 平均 值 ,中 心 极限 定 


理 隐 含 在 大 样本 条 件 下 ,Br” 有 个 通 近 于 ME, ,ipe) 的 抽样 分 布 ,其 中 


2 _ 1q var[ (Z, — z )ut,] 
OS [cov( Z, - X.) ]° (10.8) 


使 用 大 样本 分 布 的 统计 推断 。 方 差 ojrws 可 通过 估计 公式 (10.8) 中 出 现 的 方差 和 协 方 
差 来 估计 ,而 wss 估 计 值 的 平方 根 就 是 IV 估计 量 的 标准 误 。 在 经 济 计量 学 软件 包 里 ,TSLS 
回归 命令 会 自动 计算 这 个 标准 误 。 因 为 在 大 样本 条 件 下 A 服从 正 态 分 布 ,所 以 关于 局 
的 假设 检验 可 通过 计算 + 统计 量 来 进行 ,而 把 旬 的 大 样本 置信 区 间 由 BP = 1. 96sSE(BF) 
给 出 。 


10.1.5 在 香烟 需求 案例 中 的 应 用 


Wright 父子 对 黄油 的 需求 弹性 感 兴趣 ,但 是 在 今天 ,其 他 商品 .例如 香烟 .在 公共 政策 争 
论 方面 显得 更 重要 了 。 为 了 减少 由 吸烟 引起 的 疾病 和 死亡 以 及 那些 疾病 强加 在 其 他 社会 成 
员 身上 的 成 本 或 外 部 性 ,所 寻求 的 一 个 工具 就 是 征收 很 重 的 香烟 税 ,以 使 现 有 的 豚 烟 者 戒烟 
并 劝阻 潜在 的 新 吸烟 者 不 去 吸烟 。 但 是 确切 地 说 , 需 变 增加 多 大 的 税收 才 会 削弱 香烟 的 消 
费 ? 例如 ,要 使 香烟 消费 减少 20% , 税 后 的 香烟 价格 应 该 是 多 少 ? 

对 这 个 问题 的 回答 依赖 于 香烟 的 需求 弹性 。 如 果 弹 性 是 - 1, 那 么 价格 增加 20% 就 能 
达到 使 消费 减少 20% 的 目标 ;如 果 弹 性 是 -0. 5 ,那么 价格 必须 增加 40% ,才能 使 消费 减少 
20% 。 当 然 理 论 上 我 们 并 不 知道 香烟 的 需求 弹性 是 多 少 , 我 们 必须 从 价格 和 消费 的 数据 中 
估计 它 。 但 是 ,与 黄 袖 一 样 ,由 于 供给 和 需求 之 间 的 相互 作用 ,香烟 的 需求 弹性 不 能 被 对 数 
消费 量 对 对 数 价 格 的 OLS 回归 函数 一 至 地 估计 。 因 此 我 们 使 用 TSLS 来 估计 香烟 的 需求 弹 
性 ,数据 采用 1985 年 到 1995 年 美国 48 个 大 陆 州 的 年 度数 据 (附录 10. 1 中 描述 了 该 数 据 ) 。 
目前 ,所 有 结论 都 是 1995 年 各 州 截面 数据 的 结论 ,更 早年 份 的 面板 数据 的 结论 在 10. 4 节 中 
给 出 。 

工具 变量 Saje7ax,, 即 香烟 税 , 是 出 现在 总 销售 税 中 以 每 包 的 美元 数 来 测度 ( 以 实际 美 
元 测度 的 ,用 消费 者 价格 指数 进行 缩减 ) 的 部 分 。 香 烟 消 费 量 ( 0” ) 是 该 州 内 人 均 销 售 


(10.6) 








(10.7) 











内 含 外 生变 量 {included exogenous variables) ,我 们 将 其 标记 为 多; 以 及 工具 变量 5。 一般 
地 说 ,可 能 有 多 个 内 生 回归 因子 (X) 、 多 个 外 生 回 归 因 子 (下 ) 和 多 个 工具 变量 (2)。 

为 了 使 IV 回归 成 为 可 能 ,至 少 要 有 与 内 生 回 归 因 于 (XX) 一 样 多 的 工具 变量 (2)。 在 
10.1 和 节 , 只 有 一 个 内 生变 攻 和 一 个 工具 变量 。 对 这 个 单一 的 内 和 牛 回 归 因 子 而 言 ,必须 至 少 
有 一 个 工具 变量 。 如 果 没 有 工具 变量 ,我 们 就 不 能 计算 工具 变量 的 佑 计量, 不 会 有 TSILS 的 
第 一 阶段 同 归 。 


重要 概念 10. 1 
一 般 的 工具 变量 回归 模型 和 术语 
一 般 的 IV 回归 模型 是 : 
Y. =B, +B Xn + *ñ X, +, W. +t tp Wa tu =1,2, ,nn (10.12) 
其 中 : 
Wmvy, 是 因 变 量 ， 


W, EREN, CRKNE RANURA: 

请 世 ,站 是 站 个 肉 生 回归 因子 ,它们 可 能 与 上 相关 ， 

枚 到 ,多 , 是 "个 内 含 的 外 生 回 归 男子 ,它们 与 不 相关 ; 

We... ;Bi,, 是 未 知 的 回归 系数 ; 

WZ,,- ,2 是 mm 个 工具 变量 。 
如 果 工具 变量 比 内 生 回 归 因 子 多 Cm > 及) ,那么 系数 被 过 度 识 别 ; 如 果 m <, 那么 系数 被 识 
别 得 不 足 ; 如 果 m = 二 那么 系数 被 从 好 识别 。IY 回归 模型 的 升 计 要 求 恰好 识别 或 过 度 
识别 。 ' 

工具 变量 的 个 数 和 内 生 回归 因子 的 个 数 之 间 的 关系 起 以 重要 到 需要 有 其 自己 的 术语 。 
如 果 工 具 变量 的 个 数 ( 严 ) 等 于 内 生 回 归 因 子 的 个 数 (如 B m =, 那么 回归 系数 被 称 为 是 愉 
好 识别 {exactly identified) 的 ;如 果 工 具 变 量 的 个 数 (m) 超 过 内 生 回归 因 闻 的 个 数 (用 , 即 m 
> 上 ,那么 回归 系数 被 称 为 是 过 度 识别 {overidentified ) 的 ;如 果 工 具 变 量 的 个 数 (m) 少 子 内 
ERRATA TRA), BE m<, 那 么 回归 系数 被 称 为 是 不 足 识别 {underidentified} 的 。 如 
REA IV 回归 估计 系数 ,那么 系数 一 定 是 恰好 识别 的 ,或 者 是 过 度 识别 的 。 

一 般 的 IV 回归 模型 及 其 术语 在 重要 概念 10. 1 中 做 了 总 结 。 


10.2.1 —# IV 模型 中 的 TSLS 


含有 单个 内 生 回 时 内 子 的 1SLS。 当 含有 单个 内 生 回 归 因子 半 和 一 些 额 外 的 内 含 外 生 
变量 时 ,相应 的 方程 是 : 
Y =ñ, +B, X, +B W, + +B Wa +u, (10.13) 
其 中 ,和 以 前 一 样 ,XX 可 能 与 误差 项 相关 ,但 W... ,下 ,与 误差 项 不 相关 。 
TSLS 的 总 体 第 一 阶段 回归 将 工 与 外 生变 量 , 即 更 和 工具 变量 2 联系 在 一 起 ， 
X =m + += +m Z, tm. Wi to tar W. +e, (10.14) 
其 中 ,mo ,7 m. EK O3NBS 383. 是 误差 项 。 
公式 (10. 14) 有 时 被 称 为 了 的 简约 式 | reduced form) 方 程 , 它 将 内 生变 量 全 与 所 有 可 获 
得 的 外 生变 量 联系 在 一 起 ,外 生变 量 既 包括 回归 方程 中 的 变量 (四 ) ,也 包括 工具 变量 (如) 。 
在 TSLS 的 第 一 阶段 ,公式 (10. 14) 中 的 未 知 系数 由 0LS 来 悄 计 ,而 且 这 个 回归 的 预测 














HE a s 

在 TSLS 的 第 二 阶段 ,公式 (10. 13) 使 用 OLS 进行 估计 ,只 是 天 用 第 一 阶段 它 的 预测 值 
做 了 替代 ,也 就 是 说 ,用 也 WY W... WETT OLS UH. HAITIS B,,B,，…,B1,, 的 估 
计量 就 是 TSLS 估计 量 。 

EILAT bH 于。 当 有 多 个 内 生 回 归 因 子 世 ,,…, 半 ,时 ,除了 每 个 内 生 回 归 
因子 可 求 有 它 自己 的 第 一 阶段 回归 之 外 ,TSLS 的 算法 是 相似 的 。 这 些 第 一 阶段 回归 中 的 每 
一 个 都 有 与 公式 (10. 14) 相 同 的 形式 ,也 就 是 说 , 因 变 量 是 下 变量 中 的 一 个 ,而 回归 因子 是 
所 有 的 工具 变量 (2) 和 所 有 的 内 含 外 生变 量 (WW) 。 这 些 第 一 阶段 回归 共同 生成 了 每 个 内 生 
回 妇 因子 的 预测 值 。 

在 TSLS 的 第 二 阶段 ,公式 (10. 12) 用 OLS 来 估计 ,只 是 内 生 加 归 因子 (X) 被 它们 各 自 
的 预测 信 ( 世 ) 所 代替 ,所 得 出 的 相应 的 B0 ,8,,… ,Bi,, 的 估计 量 就 是 TSLS 估计 基 。 

实践 中 ,现代 经 济 计量 软件 的 TSLS 估计 命令 会 自动 运行 TSLS 的 两 个 阶段 回归 。 一 般 
的 TSLS 估计 量 在 重要 概念 10. 2 中 做 了 总 结 。 


重要 概念 10. 2 
两 阶段 最 小 二 生 

在 公式 (10. 12) 一 般 的 IY 回归 模型 中 ,含有 多 个 工具 变量 的 TSL 估计 量 是 分 两 个 阶 
段 来 计算 的 。 

1. 第 一 阶段 回归 (first-stage regression1s) ) :用 总 ,对 工具 变量 (Zi ,…,Z.) MASH 
SMEER W, Wiot OLS 回 好 。 计 算 这 个 回归 的 预测 值 ,被 称 为 么 , 。 对 所 有 内 生 回 
BATF 马 ,……, 生 重复 以 上 步骤 ,这 样 就 计算 出 了 预测 值 名 如。 

2. 第 二 阶段 回归 { second-stage regression) :用 了 对 内 生变 量 预测 值 ( 友 ,…, 友 ) 和 
Farba (W... W.) 进行 OLS mH. TSS 的 估计 量 房 ” ,…, 房 ， 就 是 第 二 阶段 


回归 的 估计 量 。 
在 实际 中 ,这 两 个 阶段 的 加 归 可 由 现代 经 济 计量 软件 中 的 TSLS 估计 命令 自动 完成 。 


10.2.2 一 般 IV 模型 中 的 工具 变量 相关 性 和 外 生性 


对 于 一 般 的 IV 回归 模型 ,工具 变量 相关 性 和 外 生性 的 条 性 需要 进行 修改 。 

当 有 一 个 内 含 外 生变 量 但 有 多 个 工具 变量 时 ,工具 变量 相关 性 的 条 件 基 ,对 给 定 的 W, 
至 少 有 一 个 Z 对 预测 六 是 有 用 的 。 当 有 多 个 内 含 的 外 生变 量 时 ,这 个 条 件 更 为 复杂 ,因为 
我 们 必须 排除 总 体 问 归 中 的 完全 多 重 共 线 性 。 直 观 上 , 当 有 多 个 内 含 的 外 生变 量 时 ,工具 变 
量 必须 提供 足够 多 的 关于 这 些 变量 外 生变 化 的 信息 以 区 分 它们 各 自 对 了 的 影响 。 

工具 变量 外 生性 条 件 的 一 般 陈 述 是 ,每 个 工具 变量 必须 与 误差 项 u, 不 相关 。 关 于 有 效 
工具 变量 的 一 般 条 件 在 重要 概念 10. 3 中 给 出 。 


重要 概念 10. 3 


有 效 工具 变量 的 两 个 条 件 
AE m IREE 4,,… ,2 的 组 全 必须 满足 下 列 两 个 条 件 才 是 有 效 的 : 








估计 所 给 出 的 标准 误 并 不 正确 ,因为 它们 没有 认识 到 它 是 两 阶段 过 程 的 第 二 个 阶段 。 具 体 
来 说 ,第 二 阶段 OLS 标准 误 没 能 对 第 二 阶段 的 回归 使 用 了 内 含 内 生变 量 的 预测 值 这 一 事实 
进行 相应 的 调整 。 进 行 必要 调整 的 标准 误 公 式 被 虞 人 到 ( 且 被 自动 使 用 ) 经 济 计量 软件 的 
TSLS 铝 妇 命令 中 。 因 二 ,如果 你 使 用 专门 的 TSL 回归 软件 ,那么 在 实际 中 这 个 问题 就 不 成 
为 问题 了 。 第 二 , 像 通常 一 样 ,误差 项 u 可 能 是 异 方 差 的 ,因此 使 用 标准 误 的 异 方差 稳健 形 
式 是 非常 重要 的 , 它 与 多 元 回归 模型 的 OLS 估计 量 使 用 异 方差 稳健 的 标准 误 是 重要 的 理由 
完全 相同 。 


10.2.5 在 香烟 需求 案例 中 的 应 用 


在 10.1 节 中 ,我 们 利用 1995 年 美国 各 个 州 的 年 度 消 费 数 据 ,使 用 含有 单个 回归 因子 
《等 包 香 烟 实 际 价格 的 对 数 ) 和 单个 工具 变量 (每 包 香 烟 的 实际 销售 税 ) 的 TSLS 估计 了 香烟 
的 需求 弹性 。 然 而 ,收入 也 影响 需求 ,因此 它 也 是 总 体 回归 误差 项 的 一 部 分 。 就 如 10. 1 节 
中 所 讨论 的 ,如 果 州 的 销售 税 与 该 州 的 收 人 有 关 ,那么 它 与 香烟 需求 方程 误差 项 中 的 某 个 变 
量 相关 ,这 就 违背 了 工具 变量 外 生性 条 件 。 如 果 是 这 样 的 话 ,10.1 节 中 的 IV 估计 量 就 是 不 
一 致 的 ,也 就 是 说 ,IV 回归 受 省 略 变量 山 差 的 影响 。 为 了 解决 这 个 问题 ,我 们 需要 在 回归 中 
HARANT., 

因此 ,我 们 考虑 一 个 可 供 选择 的 设 定 , 在 这 个 设 定 中 ,收入 的 对 数 被 包含 在 需求 方程 中 。 
根据 重要 概念 10. 1 的 术语 说 明 , 因 变量 了 是 消费 量 的 对 数 , 即 m(Q@&””“); 肉 生 回归 因 于 于 
是 实际 价格 的 对 数 , 即 nè P) ;内 会 外 生变 量 下 是 实际 人 均 州 收入 的 对 数 In ( Inc, ) ; T 
具 变量 Z 是 每 包 香烟 的 实际 销售 税 SalesTax,。TSLS 估计 值 和 ( 异 方差 稳健 的 ) 标 准 误 是 ; 


— 
Ing Q) = 9.43 - 1.14 mni P™) + O. 21 In( Inc.) (10.15) 
(1.26) (0.37) (0.31) 


这 个 回归 使 用 单个 工具 变量 SalesTax, ,但 是 实际 上 可 获得 另 一 个 候选 的 工具 变量 。 除 
了 总 销售 税 以 外 , 州 政府 征 收 只 适用 于 香烟 和 烟草 产品 的 特产 税 。 这 些 香 和 烟 特产 税 
(CigTax,) 构 成 了 另 一 个 可 能 的 工具 变量 。 香 烟 特产 税 会 使 消费 者 支付 的 香烟 价格 增加 , 因 
此 ,可 证 明 它 满足 工具 变量 相关 性 的 条 件 。 如 果 它 与 州 香 烟 需 求 方程 中 的 误差 项 不 相关 , 那 
么 它 就 是 一 个 外 生 的 工具 变量 。 

手中 有 这 个 额外 的 工具 变量 ,我 们 现在 就 有 了 两 个 工具 变量 ,每 包 香 烟 的 实际 销售 税 和 
每 包 香烟 的 实际 州 特 产 税 。 由 于 有 两 个 工具 变量 和 和 一 个 内 生 回归 因子 ,所 以 需求 弹性 被 过 
度 识别 ,也 就 是 说 ,工具 变量 的 个 数 (SalesTax, 和 CigTax, ,因此 m =2) 超 过 了 内 含 内 生变 量 
的 个 数 ( Ps ,因此 上 =1)。 我 们 可 以 使 用 TSLS 估计 需求 弹性 ,其 中 第 一 阶段 中 的 回归 因 
子 是 内 会 外 生变 量 In( jnc,) 和 两 个 工具 变量 。 

使 用 网 个 工具 变量 Sole) SalesTax, 和 CigTax, 所 得 出 的 回归 函数 的 TSLS 估计 值 是 : 


In ( Q EAD 9.89 - 1.28 n( P) + 0.28 In( Jne, ) (10.16) 
(0.96) (0.25) (0.25) 


比较 公式 (10. 15) 和 公式 (10. 16) :在 公式 (10. 16) 中 ,所 估计 的 价格 弹性 的 标准 误 要 小 
173{ 公 式 (10.16) 中 的 0.25 比 公式 (10, 15) 中 的 0.37)。 公 式 (10, 16) 中 标准 误 比 较 小 的 
原因 是 这 个 估计 值 使 用 了 比 公 式 (10. 15) 更 多 的 信息 :在 公式 (10.15) 中 ,只 使 用 了 一 个 工 
具 变量 (销售 税 ) ,而 在 公式 (10. 16) 中 ,使 用 了 两 个 工具 变量 (销售 税 和 香烟 特产 税 ) 。 使 用 
两 个 工具 变量 比 只 使 用 一 个 工具 变量 解释 了 更 多 的 香烟 价格 变化 ,而 这 又 被 反映 在 所 估计 
的 需求 弹性 有 较 小 的 标准 误差 上 。 


这 些 使 用 两 个 工具 变量 的 估计 值 更 可 信 吗 ? 最终 ,可 信 性 依赖 于 这 个 工具 变量 组 一 一 
这 里 是 两 个 税收 八 量 一 一 是 省 能 够 合理 地 满足 有 将 工具 变量 的 两 个 条 件 。 因 此 ,我们 评估 
这 些 工具 变 基 是 否 有 效 是 至 关 重 要 的 ,现在 我 们 就 来 讨论 这 个 主题 。 


-10.3 ”检查 工具 变量 的 有 效 性 - 


在 一 个 特定 的 应 用 中 ,工具 变量 回归 是 否 有 用 取决 于 工具 变量 是 否 有 效 ,无 效 的 工具 变 
量 生成 无 意义 的 结论。 因此 ,在 一 个 特定 的 应 用 中 ,评价 一 组 给 定 的 工具 变量 是 否 有 效 是 非 
常 必要 的 。 

10, 3.1 假设 1: 工 具 变量 相关 性 

在 IV 回归 中 ,工具 变量 相关 性 条 件 的 作用 是 微妙 的 。 理 解 工具 变量 相关 性 的 一 种 方法 
是 , 它 起 着 类 似 样本 容量 的 作用 :工具 变量 的 相关 性 越 强 -一 即 万 的 变 差 被 工具 变量 所 解 
释 的 越 多 一 一 在 IV 回归 中 可 获得 的 信息 越 多 。 一 个 工具 变量 的 相关 程度 越 高 ,生成 的 估计 
量 越 准 确 , 正 如 越 大 的 样本 会 生成 越 准确 的 估计 量 -一 样 。 此 外 ,使 用 TSLS 的 统计 推断 是 根 
据 TSLS 估计 基 服 从 正 态 抽样 分 布 的 假设 来 预测 的 ,但 是 根据 中 心 极限 定理 ,在 大 样本 条 件 
下 (小 样本 条 件 下 不 一 定 成 立 ) , 正 态 分 布 是 个 很 好 的 逼近 。 如 果 一 个 具有 较 高 相关 性 的 工 
具 变 量 就 像 是 拥有 较 大 的 样本 容量 的 特征 一 样 ,那么 这 意味 着 ,由 于 正 态 分 布 为 TSLS 估计 
量 的 抽样 分 布 提供 了 一 个 很 好 的 逼近 ,因此 这 些 工具 变量 不 应 该 只 是 相关 的 ,而 应 该 是 高 度 
相关 的 。 

几乎 没有 解释 X 变化 的 工具 变量 被 称 为 弱 工 具 变 量 (weak instruments), ARKE 
个 例子 中 ,该 州 到 香烟 制造 广 之 间 的 距离 可 以 认为 是 个 弱 工 具 变 量 ;虽然 较 长 距离 会 增加 运 
输 成 本 ( 这样 供给 曲线 向 里 移动 ,使 均衡 价格 上 升 ) ,但 是 香烟 的 重量 很 经 , 因此 运输 成 本 只 
是 香烟 价格 中 很 小 的 一 部 分 。 这 样 ,价格 变 差 中 由 运输 成 本 所 解释 的 量 , 也 即 由 该 州 到 香烟 
制造 广 的 距离 所 解释 的 量 , 可 能 会 非常 小 。 

本 节 讨 论 为 什么 弱 工 具 变量 是 个 问题 ,如 何 识别 弱 工 具 变量 ,以 及 如 果 存 在 弱 工 具 变 
E ,你 应 该 做 些 什 么 。 在 此 ,始终 假设 工具 变量 是 外 生 的 。 

为 什么 弱 工 具 变量 是 个 问题 ? 如 果 工 具 变量 是 弱 的 ,即使 样本 容量 很 大 , 正 态 分 布 为 
TSLS 佑 计量 的 抽样 分 布 也 只 能 提供 一 个 比较 差 的 逼近 。 这 样 ,进行 统计 推断 的 通常 方法 就 
没有 了 理论 上 的 依据 ,即使 在 天 样本 条 件 下 。 事 实 上 ,如 果 工 具 变量 是 弱 的 ,那么 TSLS 人 
计量 可 能 会 产生 严重 的 偏差 ,被 构造 为 TSLS 估计 量 +1. 96 倍 标准 误 的 95% BJ) 8 8 E: lB] n[ 
能 包含 了 远 小 于 95 名 的 机 会 的 系数 的 真实 值 。 简 而 言 之 ,如 果 工 具 变 量 是 弱 的 ,那么 TSLS 
就 不 再 可 靠 了 。 

ATRA TSLS 估计 量 抽样 分 布 在 大 样本 条 件 下 的 正 态 逼 近 也 有 问题 ,考虑 一 个 特 
殊 的 例子 , 即 10, 1 节 中 所 考虑 的 信 有 单个 内 含 内 生变 量 .单个 工具 变量 以 及 无 内 含 外 生 回 
归 因 子 的 例子 。 如 果 该 工具 变量 是 有 效 的 ,那么 后 8 就 是 - 致 的 ,因为 样本 协 方差 szy 和 szx 


是 一 致 的 ,也 就 是 说 ,Bas =; sa eov(Z,,Y,)/cov (Z, X.) = 有 (表达 式 (10.7))。 但 
是 ,现在 假设 工具 变量 不 仅 是 弱 的 , 而 且 还 是 不 相关 的 ,那么 有 o(Z,X,) =0。 这 样 ， 
s seov(Z,,X.) =0。 因 而 ,按照 字面 理解 ,右边 极限 cov( 2,,Y.)/cov(2,,X,) 的 分 母 是 01 
显然 , 当 工具 变量 相关 性 不 成 立时 ,ss 是 一 致 的 论点 就 崩溃 了 。 如 附录 10. 4 所 证 明 的 ,这 
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TAB R TAT TS 佑 计量 有 个 非 正 态 的 抽样 分 布 , 即 使 样本 容量 非常 大 。 事 实 上 ， 
当 工 具 变量 不 相关 时 , 房 ” 的 大 样本 分 布 并 不 是 正 态 随机 变量 的 大 样本 分 布 , 换 句 话说 , 它 
是 两 个 正 态 随 机 变量 之 比率 的 分 布 ! 

然而 在 实际 中 不 太 可 能 会 遇 到 这 种 完全 不 相关 的 工具 变量 的 情形 ,这 样 就 提出 了 一 个 
问题 :在 实际 中 ,工具 变量 必须 达到 多 大 程度 的 相关 才能 为 正 态 分 布 提供 一 个 很 好 的 逼近 
呢 9 在 一般 的 IV 回归 模型 中 ,这 个 问题 的 答案 是 复杂 的 。 然 而 ,幸运 的 是 ,对 于 实际 中 最 一 
般 的 情形 一 一 单个 内 生 回 归 因 子 的 情形 ,存在 一 个 可 获得 的 简单 的 经 验 规则 。 


重要 概念 10. 5 





识别 弱 工 具 变 量 的 一 个 经 验 规则 

第 一 阶段 的 下 统计 量 是 检验 两 阶段 最 小 二 乘法 第 一 阶段 中 工具 变量 Zi ，…,Zr, 的 系数 
都 等 于 0 这 一 假设 的 下 统计 量 。 当 有 一 个 内 生 回 好 因子 时 ,第 一 阶段 天 统计 量 小 于 10 HJ 
表明 ,该 工具 变量 是 弱 工 具 变 量 , 在 此 情形 下 ,TSLS 估计 量 是 有 偏 的 ( 即使 在 大 样本 条 件 
下 ) ,而 且 TSLS 的 :统计 量 和 置信 区 间 都 是 不 可 靠 的 。 

党 有 一 个 内 生 辐 内因 了 时 , 弱 工 具 变 其 的 检验 。 当 上 只 有 一 个 内 生 回归 因子 时 ,检验 弱 工 
具 变 量 的 一 种 方法 是 ,计算 检验 TSL 第 一 阶段 回归 中 工具 变量 系数 都 等 于 0 这 一 假设 的 
统计 量 。 这 个 第 一 阶段 上 统计 量 (first stage 广 - statistic) 提供 了 工具 变量 中 所 包含 的 信息 
内 容 的 测度 ,信息 内 容 越 多 , 严 统 计量 的 期 望 值 就 越 大 。 一 个 简单 的 经 验 规则 是 ,如果 第 一 
阶段 的 下 统计 量 超 过 10, 那么 你 就 不 必 担 心 弱 工具 变量 了 (为 什么 是 10 呢 ? 见 附录 
10. 4。) 。 这 个 内 容 在 重要 概念 10. 5 中 总 结 。 

WRR LAER, MARRARA? 依 情况 而 定 。 如 果 你 有 许多 工具 变量 , 那 
么 有 些 工 具 变量 可 能 比 其 他 变量 弱 。 如 果 你 有 报 少 数 的 强 工 具 变量 但 有 较 多 的 红 工具 恋 
重 , 那 么 你 最 好 是 会 弈 最 弱 的 工具 变量 ,而 将 相关 性 最 强 的 子 集 应 用 于 你 的 TSE 分 析 中 。 
当 你 舍弃 弱 工 具 变 量 时 ,你 的 TSLS 标准 误 可 能 会 增加 ,但 是 要 记 住 你 最 初 的 标准 误 是 毫 无 
意义 的 。 

然而 ,如 果 你 只 有 几 个 工具 变量 或 者 如 果 系数 被 怡 好 识别 ,那么 会 弃 弱 工具 变量 将 不 会 
有 帮助 。 在 此 情形 下 ,有 两 个 办 法 :寻找 另外 的 更 强 的 工具 变量 ,或 者 使 用 一 些 为 使 用 弱 工 
其 变量 而 特别 设计 的 高 级 分 析 工 具 。 第 一 个 办 法 要 求 熟 悉 手 中 的 问题 ,而 且 可 能 需要 重新 
设计 数据 集 和 该 项 实证 研究 的 性 质 。 第 二 个 办 法 要 求 采用 比 TSLS 对 弱 工 具 变量 更 不 敏感 
的 程序 和 方法 。 一 个 比 TSLS 对 弱 工具 变量 更 不 敏感 的 估计 量 是 有 限 信息 极 大 似 然 估计 量 
(LIML) , 见 Hayashi (2000 ,第 8.6 节 ) 或 Greene(2000, 第 16 章 )。 当 工具 变量 是 弱 工 具 变 量 
时 ,发 展 更 可 靠 的 方法 和 程序 是 当前 学 术 界 一 个 活跃 的 研究 领域 。 


一 般 兴 起 框 























一 个 引起 惊慌 的 回归 
一 种 估计 多 上 一 年 学 所 引致 收 和 人 百分比 增加 (“教育 的 回报 ”) 的 方法 ,是 使 用 个 人 数据 
中 收 人 的 对 数 对 受 教育 年 数 进行 回归 。 但 是 如 果 有 能 力 的 个 人 既 在 劳动 力 市 场 中 很 成 功 ， 
上 学 时 间 也 很 长 {也许 是 因为 这 对 他 们 更 容易 ) ,那么 受 教育 年 数 就 会 与 “天 赋 ” 这 一 遗漏 变 
量 相关 ,进而 教育 回报 的 OLS 估计 重 将 是 有 偏 的 。 由 于 先天 的 能 力 特别 难 测度 ,因此 不 能 
被 用 做 回归 因子 ,于 是 一 些 劳动 经 济 学 家 求助 于 玉 回 归来 估计 教育 的 回报 ,但 是 ,在 收入 


的 回归 中 ,什么 变量 与 受 教育 年 数 相关 而 义 与 误差 项 不 相关 呢 ? 也 就 是 说 ,什么 样 的 变量 是 
有 效 的 工具 变量 ? 

劳动 经 济 学 家 Joshua Angrist 和 Alan Krueger 建议 是 你 的 生日 。 由 于 义务 教育 法 ,他 们 
推理 认为 你 的 生日 与 受 教 育 年 数 相关 ;如 果 法 律 要 求 你 上 学 上 到 16 岁 为 止 ,并 且 你 在 1 月 
份 满 16 岁 , 这 时 你 在 十 年 级 ,那么 你 可 能 会 退学 。 但 是 ,如 果 你 在 7 月份 满 16 岁 , 那 时 你 就 
已 读 完 了 十 年 级 。 如 果 是 这 样 的 话 ,你 的 生日 满足 工具 变量 相关 性 条 件 , 但 是 在 1 月 出 生 或 
在 ?月 出 生 应 该 对 你 的 收入 没有 直接 影响 (除了 通过 受 教育 年 数 ) ,因此 ,你 的 生日 又 满足 
了 工具 变量 的 外 生性 条 件 。 他 们 通过 使 用 某 个 人 出 生 所 在 的 季度 (三 个 月 的 时 期 ) 作 为 工 
具 变 量 来 实现 上 述 的 思路 。 他 们 使 用 了 一 个 很 大 的 来 自 于 美国 入 口 普查 的 数据 样本 (他 们 
的 回归 至 少 有 329 000 个 观测 值 1) ,而 且 他 们 控制 了 其 他 变量 ,例如 工人 年 龄 。 

但 是 , 另 一 位 劳动 经 济 学 家 John Bound 对 此 表示 怀疑 。 他 知道 弱 工 具 变量 会 使 TSLS 
不 可 靠 ,并 且 担 心 虽然 样本 容量 特别 大 ,但 是 在 变量 的 一 些 设 定 中 ,出 生 的 季度 可 能 是 个 呢 
工具 变量 。 因 此 , 当 Bound 和 Krueger 下 次 进餐 碰面 时 ,争论 一 定 转 到 Angrist - Krueger 工具 
变量 是 和 否 是 弱 工 具 变量 的 问题 上 。irueger 认为 不 是 ,并 且 建 议 一 个 查 明 真 相 的 创造 性 方 
法 :为 什么 不 使 用 一 个 确实 不 相关 的 工具 变量 一 一 用 计算 机 随机 生成 的 假 的 出 生 季度 代替 
每 个 人 的 实际 出 生 季度 一 一 重新 进行 回归 ,并且 把 使 用 实际 工具 变量 和 使 用 假 的 工具 变量 
的 结果 进行 比较 呢 ? 他 们 发 现 的 结果 令 人 人 惊讶 :不论 你 使 用 实际 的 出 生 季 度 还 是 假 的 出 生 
季度 作为 工具 变量 ,这 都 不 要 紧 , 基 本 上 ,TSLS 会 给 出 一 样 的 答案 ! 

这 就 是 令 劳 动 经 济 计 量 学 家 恺 慌 的 一 个 回归 。 使 用 真实 数据 所 计算 的 TSLS 标准 误 ， 
表明 了 教育 的 回报 被 精确 地 估计 了 ,但 是 使 用 很 数据 所 计算 的 标准 误 也 是 如 此 。 当 然 , 假 数 
据 不 可 能 精确 地 估计 出 教育 的 回报 ,因为 假 的 工具 变量 是 完全 不 相关 的 。 于 是 现在 担心 的 
是 ,基于 实际 数据 的 TSLS 估计 值 就 和 基于 假 数 据 的 TSLS 估计 值 一 样 是 不 可 车 的 。 

问题 在 于 ,Angrist 与 Kroeger 的 一 些 苛 归 中 的 工具 变量 实际 上 是 很 弱 的 。 在 他 们 的 一 
些 设 定 中 ,第 一 阶段 下 统计 量 小 于 2, 远 小 于 经 验 规则 中 的 切割 点 10。 在 其 他 的 设 定 中 ， 
Angrist 与 Krueger 第 一 阶段 的 正统 计量 值 较 大 ,在 这 些 设 定 中 ,TSLS 推断 不 受 弱 工 具 变量 
问题 的 影响 。 顺 便 提 一 下 ,在 这 些 设 定 中 , 估计 出 的 教育 回报 大 约 是 8% , 稍 大 于 用 OLS 所 
估计 的 值 。” 

注 :四 在 Angrist 与 Krueger( 1991 ) 中 报道 了 最初 的 IV 回归 ,而 使 用 假 工具 变量 的 重新 分 析 发 表 在 
Bound, Jaeger 与 Baker( 1995) 中 。 


10.3.2 假设 2: 工 具 变量 外 生性 


如 果 工 具 变量 不 是 外 生 的 ,那么 SLS 就 是 不 一 致 的 :TSLS 依 概 率 收 你 于 某 个 不 同 于 加 
妇 中 总 体系 数 的 值 。 毕 竟 , 工 具 变量 回归 的 思想 就 是 工具 变量 包含 了 与 误差 项 u, EAH X, 
变化 的 信息 。 事 实 上 ,如果 工 具 变 量 不 是 外 生 的 ,那么 它 就 不 能 正确 指出 在 中 的 这 个 外 生 
变化 ,而 且 有 充分 的 理由 认为 IY 回归 没有 提供 一 致 性 的 估计 量 。 附 录 10. 4 中 总 结 了 这 个 
观点 背后 的 数学 原理 。 

能 在 在 统计 上 检验 "工具 变 组 是 外 生 的 "这 个 假设 y 不 能 。 更 精确 地 说 ,假设 你 有 和 内 
生 回归 因子 一 样 多 的 工具 变量 ( 系数 被 恰好 识别 ) ,那么 建立 “这 些 工具 变量 实际 上 是 外 生 
的 ”这 一 假设 的 统计 检验 是 不 可 能 的 ,也 就 是 说 ,经 验证 据 不 能 被 用 来 回答 这 些 工具 变量 是 
否 满 足 外 生性 限制 条 件 这 个 问题 。 在 这 种 情况 下 ,评价 所 用 的 工具 变量 是 否 是 外 生 的 惟一 
方法 是 利用 专家 的 观点 和 你 对 手中 这 一 经 验 问题 的 个 人 知识 。 例 如 ,Wright 父子 关于 农业 














供给 和 需求 方面 的 知识 会 使 他 们 建议 , 低 于 平均 的 降雨 量 似 乎 会 合理 地 使 黄油 供给 曲线 发 
生 移动 ,但 不 会 直接 地 使 需求 曲线 发 生 移动 。 

评价 一 全 工 具 变量 是 和 否 是 外 生 的 ,必须 根据 个 人 在 某 一 应 用 方面 的 知识 做 出 专家 判断 。 
然而 ,如 果 工 具 变量 比 内 生 回 归 因 子 多 ,那么 存在 一 个 有 用 的 统计 工具 应 用 于 这 个 过 程 , 即 
所 谓 的 过 度 识 别 约 东 检验 

过 度 襄 别 的 束 检验 。 假设 称 有 一 个 内 生 回 归 因 子 、 两 个 工具 变量 ,但 没有 内 含 外 生变 
量 ,那么 你 可 以 计算 两 个 不 同 的 TSES 估计 量 ,一 个 使 用 第 一 个 上 具 变 量 , 另 一 个 使 用 第 二 
个 工具 变量 。 由 于 抽样 的 变化 ,这 两 个 估计 量 将 不 会 是 一 样 的 。 但 是 ,如 果 这 两 个 工具 变量 
都 是 外 生 的 ,那么 这 两 个 估计 量 将 趋 于 相互 接近 。 但 是 如 果 这 两 个 工具 变量 生成 的 估计 量 
很 不 相同 , 那 该 怎么 办 呢 ? 此 时 你 可 能 会 明智 地 断言 ,这 两 个 工具 变量 或 者 其 中 一 个 有 癌 
题 , 或 者 两 个 都 有 问题 。 世 就 是 说 ,这 两 个 工具 变量 或 者 其 中 一 个 ,或 者 两 个 都 不 是 外 生 的 ， 
得 出 这 一 结论 应 该 是 合理 的 。 

过 度 识别 约束 的 检验 [test of overidentifying restrictions) 以 隐 合 的 方式 对 这 一 癌 题 做 
了 比较 。 我 们 之 所 以 说 是 以 陷 售 的 方式 ,是 因为 该 检验 是 在 实际 上 没有 计算 所 有 不 同 可 能 
的 IV 估计 值 的 情况 下 进行 的 。 下 面 是 检验 的 思想 。 工 具 变 量 的 外 生性 意味 着 它们 与 不 
相关 。 这 表明 工具 变量 应 该 与 如” 近似 不 相关 ,其 由 四 ”= 及 - (AL R X, + + 
有 ss 多 ) 是 使 用 所 有 的 工具 变量 所 估计 的 TSLS 回归 的 残 差 (是 近似 地 而 不 是 精确 地 ,是 因 
为 存在 抽样 变 差 。 注 意 , 这些 残 差 是 用 实际 的 慎 而 不 是 它们 第 一 阶段 的 预测 值 来 构造 
的 ) 。 困 此 ,如 果 这 些 工 具 变 量 确实 是 外 生 的 ,那么 在 is 对 工具 变量 和 内 会 外 生变 量 的 回 
归 中 ,这 些 工具 变量 的 系数 应 该 都 是 0, 这 个 假设 是 可 以 检验 的 。 

计算 过 度 识别 约束 检验 的 这 一 方法 ,在 重要 概念 10.6 中 做 了 总 结 。 检 验 的 统计 量 是 用 
仅 适用 于 同方 差 的 下 统计 量 计 算 的 。 这 个 检验 统计 量 通 常 被 称 为 ] 统 计量。 

在 大 样本 条 件 下 ,如 果 工 具 变量 不 是 能 工具 变量 ,而 且 误差 是 同方 差 的 ,那么 在 工具 变 
量 是 外 生 的 这 一 零 假 设 下 ,这 个 了 统计 量具 有 服从 自由 度 为 m -的 卡 方 分 布 (x%.;)。 需 
要 记 住 的 是 ,期 使 被 检验 约 东 条 件 的 个 数 是 ,了 统计 量 的 浙 近 分 布 的 自由 度 也 应 该 是 严 - 
,原因 是 只 有 可 能 检验 m — k 个 过 度 识 别 约 束 条 件 。 

当 系 数 被 从 好 识别 (m = 中 时 ,为 了 卉 清楚 为 什么 不 能 检验 回归 因子 的 外 生性 ,最 容易 
的 方法 就 是 考虑 只 存在 单个 内 含 内 生变 量 (k =1) 的 情形。 如 果 有 两 个 工具 变量 ,那么 你 可 
以 计算 两 个 TSL 估计 量 , 各 对 应 着 一 个 工具 变量 ,并 且 你 可 以 比较 它们 ,看 它们 是 否 接近 。 
但 是 如 果 你 只 有 一 个 工具 变量 ,那么 你 只 能 计算 一 个 TSLS 估计 其 ,你 没有 东西 和 它 进行 比 
较 。 事 实 圭 ,如 果 系 数 被 恰好 识别 ,有 m =8, 那 么 过 度 识别 检验 的 统计 量 正 好 是 0。 


重要 概念 10. 6 


TERASEI itk) 
假设 85” 是 方程 (10. 12) 中 的 TSLS HARE. E OLS 来 估计 下 列 方程 中 的 回归 系数 : 
RB 8 +8 Z, + to +8,. W, + tne Wn + e, (10. 17) 
其 中 ,e 是 回归 误差 项 。 假 定 了 代表 检验 假设 5 = … = 8, =0 的 仅 适 用 于 同方 差 的 下 统计 
量 。 过 度 识 别 约束 检验 统计 量 是 J= mF。 在 所 有 工具 变量 都 是 外 生 的 这 ~- 零 假设 下 ,在 大 
样本 条 件 下 ,了 RE Y fi. rh m -上 是 “过 度 识别 度 ”, 苑 工具 变量 的 个 数 减 去 内 生 回 
好 因子 的 个 数 。 


-10.4 ”在 香烟 需求 案例 中 的 应 用 ， 


前 面 我 们 试图 用 TSIS 法 估计 香烟 的 需求 弹性 { 保 公 式 (10. 16)) ,在 公式 (10. 16) 中 , 收 
入 是 个 内 会 的 外 生变 量 ,并 且 有 商 个 工具 变量 , 即 总 销售 税 和 香烟 特产 税 。 现 在 我 们 放下 这 
种 方法 . 转 到 对 这 些 工具 变 址 的 详细 评价 上 。 

和 10. 1 节 中 说 明 的 一 样 ,这 两 个 工具 变量 是 相关 的 ,因为 税 是 香烟 价格 的 一 个 太 的 组 
成 部 分 ,我 们 会 马上 从 实证 上 对 此 进行 分 析 。 不 过 ,我 们 首先 关注 这 样 一 个 难题 , 即 这 两 个 
税收 变量 是 否 是 外 生变 其 。 

评价 一 个 工具 变量 是 否 是 外 生变 量 , 第 一 步 是 仔细 考虑 它 为 什么 可 能 是 或 者 为 什么 可 
能 不 是 的 和 争论。 这 要 求 我 们 考虑 ,是 什么 因素 解释 了 香烟 需求 方程 中 的 误差 项 ,以 及 这 些 困 
素 是 否 与 工具 变量 相关 。 

为 什么 某 些 州 的 人 人均 香 烟 消 费 量 比 其 他 州 高 呢 ? 一 个 原因 可 能 是 各 州 之 间 的 收 大 差 
蜡 , 但 是 州 的 数 人 包含 在 公式 (10.16) 中 了 ,因此 它 不 是 误差 项 的 一 部 分 。 田 一 个 原因 是 ， 
存在 影响 需求 的 历史 因素 。 例 如 ,种 植 烟 草 的 州 比 其 他 大 多 数 州 具 有 更 高 的 吸烟 率 。 这 个 
因素 会 与 税收 有 关 胆 ? 很 可 能 有 关 。 如 果 烟 草 种 植 和 香烟 生产 是 一 个 州 的 重要 产业 ,那么 
这 些 产 业 可 以 施加 影响 以 维持 一 个 低 的 香烟 特产 税 。 这 表明 ,在 香烟 需求 中 有 一 个 遗漏 因 
素 一 一 该 州 是 否 种 植 烟 草 和 生产 香烟 一 一 可 能 与 香烟 特产 税 相关 。 

解决 误差 项 与 工具 变量 之 间 的 这 种 可 能 相关 关系 的 一 个 方法 是 ,把 该 州 烟草 种 植 和 香 
烟 生 产 的 规模 信息 包含 进来 ,这 就 是 我 们 在 将 收入 作为 回归 因子 包含 在 需求 方程 中 时 所 采 
取 的 方法 。 但 是 由 于 我 们 有 香烟 消费 的 面板 数据 , 国 此 存在 另 一 种 不 同 的 方法 ,该 方法 不 要 
求 这 个 信息 。 正 如 第 8 章 中 所 讨论 的 ,面板 数据 能 够 消除 那些 在 实体 ( 州 ) 癌变 化 但 不 随时 
间 发 生变 化 的 变量 的 影响 ,例如 决定 一 个 州 烟草 和 香烟 业 规模 大 小 的 气候 因素 和 历史 环境 。 
在 第 8 章 中 给 出 了 解决 这 个 问题 的 两 种 方法 :构造 两 个 不 同时 期 之 问 变 量变 化 的 数据 ,并 使 
用 固定 效应 回归 。 为 了 使 这 里 的 分 析 尽 可 能 简单 ,我 们 采用 前 一 种 方法 ,并 在 两 个 不 同年 份 
之 间 变量 变化 的 基础 上 采用 8.2 节 中 所 介绍 的 那 种 回归 。 

油 个 不 同年 份 之 间 的 时 间 跨 度 长 短 ,影响 我 们 对 估计 弹性 的 解释 。 由 于 香烟 是 一 种 能 
使 人 上 况 的 东西 ,因此 香烟 的 价格 变化 改变 消费 的 行为 需 花 帆 一 定 的 时 间 。 起 初 ,香烟 价格 
上 升 可 能 对 需求 几乎 没有 影响 。 不 过 ,过 一 段 时 间 后 ,价格 上 升 有 助 于 强化 一 些 吸烟 者 戒烟 
的 愿望 ,而 且 重 要 的 是 , 涨 价 可 以 打击 那些 非 吸烟 者 进 人 吸烟 者 的 行列 。 因 此 ,在 短期 内 , 需 
求 对 价格 上 升 的 反应 可 能 很 小 ,但 在 长 期 内 会 很 大 。 换 句 话说 ,对 像 理 烟 这 样 容 易 使 人 上 瘤 
的 产品 ,在 短期 内 需求 可 能 是 缺乏 弹性 的 ,也 就 是 说 , 它 可 能 有 个 接近 于 0 的 短期 弹性 ,但 是 
从 长 期 看 它 可 能 是 更 富有 弹性 的 。 

在 这 个 分 析 中 ,我 们 集中 子 估计 长 期 的 价格 弹性 ,通过 考虑 10 年 间 数 量 和 价格 所 发 生 
的 变化 来 估计 弹性 。 具 体 来 说 ,在 此 所 考虑 的 回归 方程 中 ,10 年 的 对 数 数量 变化 
In( Q) -ne ) 对 10 年 的 对 数 价格 变化 mn( PSS) -In( Pias O) 以 及 10 年 的 对 
数 收入 变化 In( Ine, is) — In( Inc, ws ) 进行 回归 。 使 用 的 两 个 工具 变量 是 ;10 年间 销售 税 的 
变化 SalesTax, jos — SatesTax, os 和 10 年 间 香烟 特产 税 的 变化 CigTax, ms - CigTax, vos e 

















T ATBERT S 1 节 和 8.2 节 中 了 =2 期 的 面板 数据 的 资料 。 








一 般 兴趣 框 
有 吸烟 的 外 部 性 

吸烟 所 强加 的 成 本 不 单单 是 只 由 吸烟 者 本 人 完全 承担 ,也 就 是 说 ,吸烟 产生 了 外 部 性 ， 
因此 ,征收 香烟 税 的 一 个 经 济 理由 就 是 将 这 些 外 部 性 “内 部 化 " 。 理 论 上 ,每 包 香 烟 的 税收 
应 该 等 于 吸 每 包 香 烟 所 产生 的 外 部 性 的 美元 价值 ,但 是 ,以 美元 测度 的 吸 每 包 香 烟 所 产生 的 
外 部 性 确切 地 说 是 煞 少 昵 ? 

径 有 的 几 项 研究 使 用 了 经 济 计 量 方法 估计 吸烟 的 外 部 性 。 由 其 他 人 所 承担 的 负 外 部 性 
一 一 成 本 一 一 包括 政府 为 了 照顾 有 病 的 吸烟 者 所 支付 的 医疗 费用 , 因 间 接 吸烟 所 引致 的 非 
吸烟 者 的 保健 费用 以 及 由 香烟 所 引起 的 火灾 损失 。 

但 是 ,从 纯粹 的 经 济 学 观点 来 看 ,吸烟 也 有 正 的 外 部 性 或 利益 。 吸 烟 的 最 大 好 处 就 是 吸 
烟 者 站 社会 保障 (公共 养老 金 ) 税 方面 倾向 于 支付 的 比 他 们 曾 得 到 的 回报 多 得 多 。 在 吸烟 
老人 的 家 庭 护 理 费 用 上 也 有 大 量 的 节省 ,因为 吸烟 者 倾向 于 不 会 那么 长 寿 。 由 于 在 吸烟 者 
活着 的 时 杉 豚 烟 产生 灸 的 外 部 性 ,但 在 其 死 后 产生 正 外 部 性 的 累积 ,因此 ,每 包 香 烟 外 部 性 
的 净 现 值 { 每 包 香 烟 的 净 成 本 值 贴现 到 现在 ?依赖 于 贴现 率 。 

该 研究 并 没有 在 兆 外 部 性 的 具体 美元 价值 上 取得 一 致意 见 。 一 些 研 究 指 出 ,经 过 适当 
贴现 以 后 的 净 外 部 性 是 很 小 的 ,小 于 当前 的 税收 额 。 实 际 上 ,最 极端 的 估计 表明 , 净 外 部 性 
是 正 的 ,因此 吸烟 应 该 受到 补贴 。 另 一 些 研究 表明 (这 些 研 究 考 虑 了 那些 可 能 是 重要 的 但 
却 很 难 量 化 的 成 本 ,例如 照顾 那些 因 母 亲 吸 烟 而 不 健康 的 女儿 ) ,每 包 香 烟 的 外 部 性 可 能 是 
1 美元 ,甚至 更 名 ,但 是 所 有 的 研究 都 一 致 认为 ,中 年 后 期 死亡 的 吸烟 者 所 支付 的 税 比 他 们 
在 短暂 的 退 体 期 间 所 得 到 的 间 报 要 多 。? 

注 : 由 关于 吸烟 外 部 性 的 早期 计算 结果 是 由 Willard G. Manning 3 ( 1989) 报告 的 。Barendregt 等 
{1997) 所 给 出 的 计算 表明 ,如 果 每 个 人 都 戒烟 ,那么 保健 成 本 会 上 升 。 关 于 吸烟 外 部 性 的 其 他 研究 成 果 ， 
由 Chaloupka 和 Warner ( 2000) # T 8228: , 





表 10 一 1 使 用 美国 48 个 州 的 面板 数据 ,香烟 需求 的 两 阶段 景 小 二 么 估计 值 
因 变 量 :ln{ Q) -In( Ones 
elt i F (1) (2) (3) 
-0.94"* -1.34"° -1.20"° 


agare s ee 
MOP Ce ) (0.21) (0.23) (0.20) 


0.53 0.43 0.46 
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TATE HER ”香烟 特产 税 销售 税 和 香烟 特产 税 
第 一 阶段 统计 若 33.70 107. 20 88. 60 

过 度 识别 约束 了 检验 和 一 一 4.93 

P f (0. 026) 


šE ik EE. B| AJ H 3 El 48 个 州 的 数据 (10 年 差分 的 48 个 观测 值 ? 来 估计 的 。 附 录 10.14863 f X° 
数据 。 在 重要 概念 10.6 中 描述 了 过 度 识 别 约束 的 了 检验 ( 它 的 p 值 在 括号 中 给 出 ) ,而 在 重要 概念 10.5 中 
描述 了 第 一 阶段 下 统计 量 。 单 个 系数 在 " 5 名 的 显著 性 水 平 下 或 “1 名 的 显著 性 水 平 下 在 统计 上 是 显 
著 的 。 





结果 在 表 10 一 ! 中 给 出 。 和 通常 一 样 , 表 中 每 一 列表 示 不 同 回归 的 结果 。 所 有 回归 者 
用 相同 的 回归 因子 ,并 都 使 用 TSLS 估计 所 有 的 系数 ,这 三 个 回归 之 间 的 惟一 差别 就 是 所 使 
用 的 工具 变量 组 不 同 。 在 第 (1) 列 中 ,惟一 的 工具 变量 是 销售 税 ;在 第 (2) 列 中 ,惟一 的 工具 
变量 是 香烟 特产 税 ;在 第 (3) 列 中 ,两 个 税收 都 被 用 做 工具 变量 。 

在 IV 回归 中 ,系数 估计 值 的 可 靠 性 取决 于 工具 变量 的 有 效 性 ,因此 ,在 表 10 一 ! 中 ,所 
要 考虑 的 第 一 个 问题 就 是 评价 工具 变量 有 效 性 的 诊断 统计 量 。 

第 一 ,工具 变量 是 相关 的 吗 ? 三 个 回归 中 的 第 一 阶段 统计 量 分 别 是 33.7,107.2 和 
88.6, 在 所 有 这 三 个 回归 中 ,第 一 阶段 下 统计 量 都 超过 了 10。 我 们 由 此 断言 ,这 些 工具 变量 
都 不 是 弱 工 具 变 量 ,因此 ,我 们 可 以 依赖 所 估计 的 系数 和 标准 误 的 统计 推断 ( 仍 设 检验 和 置 
信 区 闻 ) 的 标准 方法 。 

第 二 ,工具 变量 是 外 生 的 吗 ? 由 于 第 (1) 列 和 第 (2) 列 中 的 每 个 回归 都 合 有 一 个 工具 变 
量 和 一 个 内 会 内 生 回归 因子 ,因此 这 些 回 归 中 的 系数 都 被 恰好 识别 。 这 样 ,在 这 两 个 回归 
中 ,我们 就 不 能 进行 了 检验 了 。 然 而 ,第 (3) 列 中 的 回归 被 过 度 识 别 , 因 为 有 两 个 工具 变量 
和 一 个 内 含 回 归 因 子 , 所 以 有 一 个 (m -上 =2 -1=1) 过 度 识 别 约 束 。 了 统计 量 是 4. 3, 它 服 
从 如 分 布 ,因此 ,5% 的 痢 界 值 是 3.84( 见 附 表 3) ,两 个 工具 变量 都 是 外 生 的 这 一 零 假 设 在 
5 多 的 显著 性 水 平 下 被 拒绝 ( 这 个 推断 也 可 以 根据 表 10 一 1 中 所 给 出 的 0. 026 的 p 值 直接 
得 出 ) 。 

J 统计 量 拒绝 的 原因 是 ,这 两 个 工具 变量 生成 了 根本 不 同 的 估计 系数 。 当 惟一 的 工具 
变量 是 销售 税 ( 第 (1) 列 ) 时 ,估计 的 价格 弹性 是 - 94 ,但 是 当 惟 一 的 工具 变量 是 香烟 特产 
税 时 ,所 估计 的 价格 弹性 是 -1 34。 回 忆 一 下 了 统计 量 的 基本 思想 :如 果 两 个 工具 变量 都 是 
外 生 的 ,那么 使 用 单个 工具 变量 的 两 个 TSLS 估计 量 是 一 致 的 ,其 值 只 会 因 随机 抽样 变 差 而 
互 不 相同 。 然 而 ,如 果 一 个 工具 变量 是 外 生 的 ,而 另 一 个 不 是 ,那么 基于 内 生 工 具 变量 的 估 
计量 就 是 不 一 致 的 。J 统计 量 就 可 洞悉 这 一 点 。 在 这 个 应 用 中 ,这 两 个 所 估计 的 价格 弹性 
之 间 的 差异 相当 大 ,因此 它 不 可 能 是 纯粹 抽样 变 差 的 结果 ,因此 7 统计 量 拒 绝 了 两 个 工具 变 
量 都 是 外 生 的 这 个 零 假设 。 

J 统计 量 拒绝 意味 着 第 (3) 列 中 的 回归 是 以 无 效 的 工具 变量 为 基础 的 (工具 变量 外 生性 
条 件 不 成 立 ) , 那 第 (1) 列 和 第 (2) 列 中 的 估计 值 意 味 着 什么 呢 ? J 统计 量 拒绝 说 明 ,至 少 有 
一 个 工具 变量 是 内 生 的 ,因此 有 三 种 逻辑 可 能 性 :销售 税 是 外 生 的 ,但 香烟 特产 税 不 是 ,在 此 
情形 下 ,第 (1) 列 中 的 回归 是 可 靠 的 ;香烟 特产 税 是 外 生 的 ,但 销售 税 不 是 ,因此 ,第 (2) 列 回 
归 是 可 千 的 ;两 个 税 都 不 是 外 生 的 ,因此 两 个 回归 都 不 可 靠 。 统 计 证 据 并 不 能 告诉 我 们 哪 一 
种 可 能 性 是 正确 的 ,所 以 我 们 必须 进行 判断 。 

我 们 认为 总 销售 税 的 外 生性 要 比 香 烟 特 产 税 的 外 生性 强 ,因为 政治 过 程 能 够 将 香烟 特 
产 税 变化 和 香烟 市 场 以 及 吸烟 政策 变化 联系 起 来 。 例 如 , 如 果 一 个 州 的 吸烟 量 因 吸 烟 变 得 
过 时 而 降低 ,那么 将 会 有 更 少 的 吸烟 者 ,反对 香烟 特产 税 增加 的 游说 声音 也 会 减弱 ,这 上 反 过 
来 会 导致 更 高 的 香烟 特产 税 。 这 样 ,偏好 (这 是 4 的 一 部 分 ) 的 变化 可 能 与 香烟 特产 税 ( 工 
具 变 量 } 的 变化 相关 。 这 表明 ,要 对 将 惟一 的 香烟 税 作为 工具 变量 所 得 出 的 IV 估计 值 打折 
扣 。 这 里 相应 的 建议 是 ,只 采用 将 总 销售 税 作 为 工具 变量 所 估计 的 价格 弹性 值 -0. 94。 

-0. 94 的 估计 值 表明 了 香烟 消费 并 不 是 非常 缺乏 弹性 的 :价格 增加 1% 导致 香烟 消费 
减少 0. 94%% 。 对 香烟 这 样 使 人 上 净 的 产品 ,这 看 上 去 可 能 是 令 人 剧 订 的 ,但 是 要 记 住 ,这 个 
弹性 是 用 10 年 间 的 数据 变化 计算 的 ,所 以 它 是 长 期 阐 性 。 这 个 估计 值 表明 , 增 税 能 够 对 香 
烟 消 费 产生 豆 大 影响 ,至少 在 长 期 是 这 样 。 











这 黄 个 效应 的 一 些 复杂 的 组 合 。 这 个 问题 不 可 能 通过 找到 更 好 的 控制 变量 来 解决 。 

不 过 ,这 个 联 立 因 果 偏 差 可 以 通过 找到 一 个 合适 的 工具 变量 ,使 用 TSL 来 消除 。 找 到 
的 上 具 变 量 必须 与 监禁 率 相关 ( 即 它 必 须 是 柑 关 的 ) ,但 基 它 也 一 定 与 我 们 所 研究 的 犯罪 率 
方程 中 的 误差 项 不 相关 ( 即 它 必须 是 外 生 的 )。 也 就 是 说 , 它 必 须 影 响 监 禁 率 ,但 是 与 决定 
犯罪 率 的 任何 未 观测 到 的 因素 又 不 相关 。 

到 哪里 去 找 那 些 虽 影响 临 禁 率 但 对 犯罪 率 没有 直接 影响 的 因素 呢 ? 一 处 就 是 反映 现 有 
监 狼 容 朋 外 生变 化 的 涯 素 。 由 于 建造 监狱 花费 的 时 间 长 ,因此 ,短期 容量 约束 会 迫使 州 政府 
提前 释放 因 犯 ,或 者 减少 监禁 率 。 使 用 这 种 推理 ,Levitt( 1996 ) 建议 可 将 针对 减少 监狱 过 度 
拥挤 的 诉讼 作为 一 个 工具 变量 ,并 且 他 使 用 从 1972 年 到 1993 年 美国 州 的 面板 数据 证 实 了 
这 个 思路 。 

测度 过 度 拥 挤 诉 讼 的 变量 是 有 效 的 工具 变量 吗 ? 虽然 在 Levin 的 研究 数据 中 他 没有 给 
出 第 一 阶段 三 统计 量 , 但 是 监狱 过 度 拥 挤 的 诉讼 减缓 了 囚犯 监禁 的 增长 ,这 表明 这 个 工具 
变量 是 相关 的 。 由 于 过 度 拥挤 诉讼 是 由 监狱 条 件 引 起 的 ,而 不 是 由 犯罪 率 或 它 的 决定 性 因 
索引 起 的 ,因此 ,从 这 个 意义 上 说 ,这 个 工具 变量 是 外 生 的 。 由 于 Levin 将 过 度 拥挤 诉讼 分 
解 成 好 几 个 类 型 ,这样 就 有 好 儿 个 工具 变量 ,因此 他 能 够 检验 过 度 识别 约 东 ,使 用 , 检验 不 
能 拒绝 它们 ,这 就 支持 了 他 的 工具 变量 是 有 效 的 这 一 结论 。 

Levin 使 用 这 些 工具 变量 和 TSIS 估计 了 监禁 对 犯罪 率 的 效应 是 巨大 的 。 这 个 估计 效 
应 比 用 OLS 估计 的 效应 大 3 们 ,这 表明 OLS 遭受 了 很 大 的 联 立 因果 偏差。 

前 减 班级 规模 会 提高 考试 成 绩 吗 ? 如 我 们 在 第 2 部 分 的 实证 分 析 中 所 看 到 的 ,具有 小 
班 的 学 校 倾向 于 更 富有 ,学 生 在 学 校内 外 拥有 更 雾 的 学 习 机 会 。 在 第 2 部 分 中 ,我 们 通过 控 
制 学 生 宣 裕 程度 ,说 英语 的 能 力 等 的 不 同 测 度 ,使 用 多 元 回归 方法 处 理 遗 漏 变 量 偏 差 的 威 
胁 。 怀 疑 者 仍然 想 知道 我 们 做 的 是 否 充 分 ,如 果 我 们 遗 沽 了 重要 的 东西 ,我 们 的 班级 规模 效 
应 的 估计 值 仍 然 会 有 偏差 。 

这 个 潜在 的 被 遗漏 变 基 的 偏差 可 以 通过 引入 俗 当 的 控制 变量 来 解决 ,但 是 如 果 这 些 数 
据 是 不 可 获得 的 (有 些 难 于 测度 , 像 校外 学 习 机 会 ) ,那么 一 个 可 殿 选 择 的 方法 是 使 用 IV 回 
归 。 这 个 回归 要 求 存 在 一 个 与 班级 规模 相关 ( 相关 性 ) ,但 是 与 枸 成 误差 项 的 被 遗漏 的 考试 
成 绩 的 决定 性 因素 (例如 ,家 长 的 学 习 兴 趣 ,校外 的 学 习 机 会 教师 的 质量 和 学 校 设备 等 等 
不 相关 (外 生性 ) 的 工具 变量 。 

到 哪 去 寻找 这 个 引起 斑 级 规模 发 生 随机 性 外 生变 差 ,但 与 考试 成 绩 的 其 他 决定 性 因素 
又 无 关 的 工具 变量 呢 ? Hoxby(2000) 建 议 在 生物 学 领域 寻找 。 由 于 出 生日 期 随机 波动 , 因 
此 新 入 幼儿 园 的 班级 规模 在 不 同年 份 间 是 变化 的 。 昌 然 进入 幼儿 园 的 实际 儿童 数 可 能 是 内 
生 的 ( 关于 学 校 的 近期 新 闻 可 能 会 影响 家 长 是 否 将 孩子 送 到 秘 立 学 校 ) ,但 是 她 论证 说 进入 
幼儿 园 的 潜在 儿童 数量 一 一 该 地 区 内 的 4 岁 儿 童 数 一 一 主要 是 儿童 出 生日 期 随机 波动 的 
问题 。 

潜在 人 学 人 数 是 个 有 效 的 工具 变量 吗 ? 它 是 否 是 外 生 的 依赖 于 它 是 否 与 未 观测 到 的 班 
级 规模 的 决定 性 因素 相关 。 泊 在 人 学 人 数 在 生物 学 上 的 波动 确实 是 外 生 的 ,但 是 潜在 人 学 
人 数 也 会 因 幼 童 家 长 选择 搬 进 正在 改进 的 校区 和 搬出 处 于 困境 中 的 校区 而 波动 。 如 果 是 这 
样 的 话 ,那么 潜在 人 学 人 数 的 增加 可 能 与 诸如 学 校 管理 质量 这 样 难以 观测 的 因素 相关 ,进而 
使 这 个 工具 变量 变 得 无 效 。Hoxby 通过 以 下 的 推理 来 解决 这 个 问题 :潜在 学 生 群 体 的 增长 
或 下 降 会 在 几 年 内 平稳 地 发 生 ,而 出 生日 期 的 随机 波动 会 在 潜在 的 人 学 和 人数 上 产生 短期 的 
“尖峰 ”。 因 此 ,她 不 将 潜在 人 学 人 数 , 市 是 将 潜在 入 学 入 数 与 它 的 长 期 趋势 的 离 差 作为 工 









































具 变 起 。 这 些 离 差 满足 工具 变量 的 相关 性 准则 (第 一 阶段 中 统计 量 者 超过 了 100) 。 她 举 了 
一 个 很 好 的 例子 说 明 该 工具 变量 征 外 生 的 ,但 是 和 在 所 有 IV 分 析 中 一 样 ,这 个 假设 的 可 靠 
性 最 终 还 是 一 个 判断 性 问题 。 

Hoxby 使 用 康涅狄格 州 在 20 Hrzn 80 年 代 和 90 年 代 小 学 的 详细 面板 数据 ,证 实 了 她 的 
这 个 策略 。 该 面板 数据 集 允 许 她 把 学 校园 定 效 应 包括 进来 ,除了 工具 变量 策略 之 外 ,学 校园 
定 效应 解决 了 在 学 校 层次 出 现 的 遗漏 变量 偏差 问题 。 她 的 TSLS 估计 值 表明 ,班级 规模 对 
考试 成 绩 的 效应 是 很 小 的 ,她 的 大 部 分 估计 值 在 统计 上 都 是 不 显著 地 异 于 0 的 。 

对 心脏 病人 进行 积极 治疗 会 延长 寿命 四 ? 对 心脏 病 ({ 学 术 上 称 为 急性 心肌 梗塞 或 AMI) 
患者 而 言 ,新 的 积极 治疗 挽救 了 潜在 病人 的 生命 。 在 一 种 新 的 疗法 一 一 在 这 个 重子 中 是 心 
前 , 它 要 经 历 临床 实验 , 即 设计 一 系列 的 随机 化 控制 
实验 来 测度 它 的 作用 和 副作用 ,但 是 ,临床 试验 中 效果 好 是 一 回 和 事 , 现 实 中 的 实际 效果 则 是 
另 一 回 事 。 

估计 心肌 导管 插 人 术 在 现实 中 效果 的 一 个 自然 的 出 发 点 是 ,比较 接受 这 种 治疗 的 病人 
和 设 有 接受 这 种 治疗 的 病人 ,这 会 导致 用 病人 存活 的 时 间 对 二 元 处 理 变 量 ( 病 人 是 否 接受 
心肌 导管 搬 人 术 ) 和 其 他 影响 死亡 的 控制 变量 { 年 龄 .体重 .其 他 可 测度 的 健康 条 件 等 等 ) 进 
行 回 归 。 该 指示 变量 的 总 体系 数 就 是 这 种 疗法 所 提供 的 病人 预期 寿命 的 增 量 。 不 幸 的 是 ， 
OLS 估计 量 受 偏差 的 影响 :心肌 导管 插入 术 并 不 是 随机 地 “正好 发 生 ” 在 一 个 病人 身上 ,更 
确切 地 说 , 它 是 因为 病人 和 医生 断定 它 可 能 会 有 效 才 被 执行 的 。 如 果 他 们 (她 们 ) 的 决策 部 
分 地 以 和 健康 结果 有 关 的 不 在 数据 集中 的 那些 难以 观测 的 因素 为 基础 ,那么 治疗 决策 将 会 
与 回归 误差 项 相关 。 如 果 最 健康 的 病人 是 接受 该 项 治疗 的 病人 ,那么 OL 估计 量 将 是 有 偏 
的 (治疗 与 更 漏 变 量 相关 ) , 则 该 项 治疗 看 上 去 将 比 它 实际 的 情况 更 有 效 。 

使 用 一 个 有 效 的 工具 变量 ,通过 JIVY 回归 ,可 以 消除 这 个 潜在 的 偏差 。 该 工具 变量 必须 
与 治疗 相关 ( 即 必须 是 相关 的 ) ,但 同时 又 必须 与 影响 生存 的 被 省 略 的 健康 因素 不 相关 ( El 
必须 是 外 生 的 ) 。 

除了 通过 它 的 治疗 效果 外 ,到 哪里 去 寻找 影响 治疗 但 又 不 影响 健康 结果 的 因素 呢 ? 
McClellan ,MeNeil 与 Newhouse( 1994) 建议 从 地 理学 第 度 去 寻找 。 他 们 数据 集中 的 大 部 分 医 
院 并 不 专攻 心肌 导管 插入 术 .因此 ,许多 病人 更 接近 不 提供 这 种 治疗 的 “常规 ”医院 ,而 不 接 
近 提 供 心肌 导管 桂 人 术 的 医院 。 所 以 ,McClellan ,MeNeil 与 Newhouse 将 AMI 病人 的 家 到 最 
近 的 心肌 导管 插 人 人 术 医 院 的 距离 和 到 最 近 的 任何 类 型 医院 的 呀 离 之 差 作为 工具 变量 。 如 果 
最 近 的 医院 是 心肌 导管 插入 术 医 院 ,那么 这 个 距离 就 是 0; 否 旭 , 它 就 是 正 的 。 如 果 这 个 相 
对 距离 影响 了 接受 这 种 治疗 的 概率 ,那么 它 是 相关 的 。 如 果 在 AMI BANE 是 随机 分 布 
的 ,那么 它 是 外 生 的 。 

到 最 近 的 心肌 导管 插 人 术 医 院 的 相对 呀 离 是 个 有 效 的 工具 变量 吗 ? MeClellan, McNeil 
与 Newhouse 没有 给 出 第 一 阶段 的 正统 计量 ,但 是 他 们 却 提 供 了 它 不 是 弱 工 具 变 量 的 其 他 经 
验证 据 。 这 个 距离 测度 是 外 生 的 吗 ? 他 们 给 出 了 两 点 理由 。 第 一 ,他 们 利用 他 们 的 医学 专 
业 知 识 和 保健 系统 知识 ,认为 到 医院 的 距离 与 任何 难以 观测 的 决定 AMI 结果 的 变量 似乎 是 
不 相关 的 。 第 二 ,他 们 拥有 一 些 影 响 AMI 结果 的 其 他 变量 的 数据 ,如 病人 的 体重 ,并 且 在 他 
们 的 样本 中 ,距离 与 这 些 可 观测 的 生存 决定 性 因素 是 不 相关 的 。 他 们 认为 ,这 使 距离 与 误差 
项 中 难以 观测 到 的 决定 性 因素 之 间 不 相关 更 为 可 信 。 














% ONIRE RE MFE, 在 这 种 疗法 中 ,导管 或 者 管子 被 宪 入 到 血管 中 ,并 被 引 向 到 达 必 租 的 所 有 路 径 以 获 
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. 工具 变量 回归 是 当 一 个 或 多 个 回归 因子 与 误差 项 相关 时 估计 回归 系数 的 一 种 方法 。 
， 在 所 和 研究 的 回归 方程 中 ,内 生变 量 与 误差 项 相关 ,外 生变 量 与 该 误差 项 不 相关 。 
. 要 使 工具 变量 是 有 效 的 , 则 :(1) 它 一 定 与 内 含 内 生变 量 相关 ;(2) 它 一 定 是 外 生 的 。 
. IV 回归 要 求 至 少 有 与 内 会 内 生变 量 一 样 多 的 工具 变 其 。 
.TSLS 估计 量 有 两 个 阶段 ;第 一 阶段 ,内 含 内 生变 量 对 内 含 外 生变 量 和 工具 变量 进行 
回归 ;第 二 阶段 , 关 变 量 对 内 含 外 生变 量 和 由 第 一 阶段 回归 中 得 出 的 内 会 内 生变 量 的 预测 值 
进行 回归。 

6， 弱 工具 变量 ( 与 内 会 内 生变 量 几 乎 不 相关 的 工具 变量 ) 使 TSL 估计 量 有 偏 ,而 且 使 
TSLS 置信 名 间 各 假设 检验 不 可 靠 。 

7， 如 果 一 个 王 具 变量 不 是 外 生 的 ,那么 其 TSLS 估计 量 是 不 一 致 的 。 
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[重要 术语 - 


工具 变 最 [IV) MH ”工具 变量 (工具 ) WETE 外 生变 量 工具 变量 相关 性 条 人 性 
工具 变量 外 生性 条 件 ”两 阶段 最 小 二 乘 ” 内 含 外 生变 量 ”恰好 识别 过度 识别 PER 
别 ”简约 式 ”第 一 阶段 回归 ”第 二 阶段 回归 STATE 第 一 阶段 统计 量 ”过度 识 
别 约束 检验 





[复习 概念 ] 


10.1 在 方程 (10. 3) 的 需求 曲线 回归 模型 中 ,ln(P”* ) 与 误差 u, 是 正 相关 还 是 负 相 
关 ? 如 果 用 OLS 估计 号 ,你 认为 B, 的 估计 值 比 它 的 真 值 大 还 是 小 呢 ? 请 解释 说 明 。 

10.2 在 本 章 香烟 需求 的 案例 研究 中 ,假设 我 们 将 这 个 州 的 人 均 树木 数量 作为 一 个 工 
具 变 量 , 这 个 工具 变量 是 相关 的 吗 ? 它 是 外 生 的 吗 ? 它 是 个 有 效 的 工具 变量 吗 ? 

10.3 在 监禁 对 犯罪 率 影响 的 研究 中 ,假设 Levit 将 人 均 律 师 数 作为 工具 变量 ,这 个 工 
有 具 变 量 是 相关 的 吗 ? 它 是 外 生 的 吗 ? 它 是 个 有 效 的 工具 变量 吗 ? 

10.4 在 心肌 导管 插 人 术 效 果 的 研究 中 ,MeClellan ,MeNeil 与 Newhouse( 1994) 将 病人 
到 心肌 导管 插入 术 医院 的 距离 和 到 常规 医院 的 距离 之 差 作为 工具 变量 。 你 如 何 决 定 这 个 工 
具 变 量 是 否 是 相关 的 ? 你 如 何 决定 这 个 工具 变量 是 将 是 外 生 的 ? 


[练习 


"10.1 这 个 问题 涉及 表 10—I 中 所 总 结 的 面板 数据 回归 。 

a. 假设 联邦 政府 正 考 虑 一 种 关于 香烟 的 新 税收 ,估计 会 使 每 包 香烟 的 零售 价格 增加 
0. 10 美元 ,如 果 每 色香 烟 的 当前 价格 是 2. 00 美元 ,使 用 第 (1) 列 中 的 回归 预测 需求 的 变化 ， 
构造 需求 变化 的 95 免 的 置信 区 间 。 

bp， 假设 美 国 进 入 经 济 衰退 期 ,收入 下 降 2% ,使 用 第 (1) 列 中 的 回归 预测 需求 的 变化 。 

e. 通常 训 退 期 持续 不 到 一 年 。 你 认为 第 (11 列 中 的 回归 会 为 问题 (b) 提供 一 个 可 区 的 





bp 


答案 吗 ?” 为 什么 ? 

d 假设 第 (1) 列 中 的 正统 计量 是 3.6, 而 不 是 33.6, 那 么 这 个 回归 会 为 (a) 中 所 提出 的 
问题 提供 一 个 可 靠 的 答案 四 9? 为 什么 ? 

10.2 ”考虑 含有 一 个 回归 因子 的 回归 模型 :下 =r +A +u, ,假定 满足 重要 概念 4 3 
中 的 假设 。 

a 证明:X, 是 个 有 效 的 工具 变量 ,也 就 是 说 ,证 明 重 要 概念 10. 3 满足 Z =X. 

b， 证 明 : 重 要 概念 10. 4 中 的 IV 回归 假设 满足 Z, 的 选择 。 

e. 证 明 : 使 用 2 = X, 所 构造 的 IV 个 计量 等 网 于 OLS 估计 量 。 

10.3 一 个 同学 对 估计 方程 (10. 1) 中 误差 项 的 方差 感 兴趣 。 


a 假设 她 使 用 TSLS 第 一 阶段 回归 中 的 估计 量 :6 = -5 X (Y-A -AR 
rh £ 是 来 自 于 第 一 阶段 回归 的 拟 合 值 。 这 个 估计 量 是 一 致 的 吗 ? ( 为 了 回答 这 个 问题 , 候 
设 样本 量 非 常 大 ,TSLS 估计 量 实质 上 等 同 于 B, MA) 

baish D -AP -APA 是 一 到 的 由? 

10.4 ” 考 虚 一 个 含有 单个 内 合 内 生变 量 和 单个 工具 变量 的 TSL 估计 ,那么 ,第 一 阶段 
MHARE $, =m + .2,。 使 用 样本 方差 和 样本 协 方差 的 定义 证 明 sf = mis; fl sh = 
个 。 使 用 这 个 结论 填写 附录 10. 2 中 公式 (10.4) 的 推导 步骤 。 





[附录 10. 1 香烟 消费 面板 数据 集 ] 


该 数据 集 由 1985 年 到 1095 年 美国 48 个 大 陆 州 的 年 度数 据 构 成 。 香 茵 消费 量 是 用 每 
财政 年 度 里 以 包 为 单位 计算 的 人 均 香 烟 销售 量 调 度 的 , 它 是 从 州 税收 数据 中 导出 的 。 价 格 
是 该 财政 年 度 期 间 每 包 香 烟 的 平均 零 肯 价 , 包 括 税 收 。 收 入 是 人 均 收 入。 由 于 广泛 基准 的 
州 销售 税 适用 于 所 有 的 消费 品 ,因此 一 般 销售 税 就 是 以 美 分 计算 的 每 包 竺 茵 的 平均 税 。 香 
烟 特 产 税 是 只 适用 于 香烟 的 税 。 本 章 回 归 分 析 中 所 使 用 的 所 有 价格 . 收 人 和 税收 均 用 消费 
者 价格 指数 进行 了 缩减 , 因此 它们 是 以 实际 美元 即 不 变价 计算 的 。 我 们 感谢 MIT 的 
Jonathan Gruber 教授 向 我 们 提供 了 这 些 数据 。 


[附录 10.2 公式 (10.4) 中 TSLS 估计 量 公式 的 推导 ] 


TSLS 的 第 一 阶段 是 用 工 对 工具 变量 Z, 进行 OLS 回归 ,并 计算 OLS 预测 值 名, 而 第 二 
阶段 就 是 用 Y, 对 X, 进行 OLS 回归 。 因 此 ,TSLS 估计 量 的 公式 (用 预测 秆 名 来 表达 ) ,就 是 
重要 概念 4 2 中 OLS 怖 计量 的 公式 ,其 中 用 针 RET X, E Ar sps, RP sit, 的 样 
本 方差 ,sj 是 了 和 多 之 间 的 样本 协 方差 。 

H TX E X 在 第 一 阶段 回归 中 的 预测 值 ,全 = 7, + 7 2 ,所 以 样本 方差 和 协 方差 的 定 
义 暗 合 着 sgy msni = ms (网 练习 10.4)。 因 此 ,TSLS 估计 量 可 被 写 咸 B =s ss = 
szy/ (个 52)。 最 后 ,分 , 是 来 自 TSLS 第 一 阶段 的 OLS 斜率 系数 ,所 以 m = szr/sz。 将 这 个 表 
Kati Z, RAAR AS =, (Task) , 便 得 到 了 公式 (10.4) 中 的 TSLS 估计 量 公式 。 





,附录 10.3 TSLS 估计 量 的 大 样本 分 布 ] 


本 附录 研究 了 在 10. 1 节 中 所 考虑 的 条 件 下 , 即 有 单个 工具 变量 .单个 内 含 内 生变 量 ,而 
没有 内 含 外 生变 量 的 条 件 下 ,TSLS 估计 量 的 大 样本 分 布 。 

一 开始 ,我 们 以 误差 的 形式 导出 了 TSLS 估计 量 的 一 个 公式 ,这 个 公式 构成 了 下 面 讨论 
的 基础 ,类 似 于 附录 4.3 中 公式 (4. 51) 的 OLS 估计 量 的 表达 式 。 根 据 公式 (10. 1) 有 :Y. -Y 
=B (ZE - X) + (u, — ü) ,因此 ,2 和 了 之 问 的 样本 协 方差 可 被 表示 为 : 


sr 





1 


= 局 3ax +- $, (Z -Z)(w, - 1) 


=Blszx + $ (Z -Z)u, (10.18) 





r È (Z, -2) [B (X, -3) + (u, =ô) 


其 中 ,sz = 一 Y (Z. -2) (X, - X) ,而 且 这 里 最 后 一 个 等 式 是 由 Y (Z-Z) =0 推导 


出 来 的 。 将 sw 的 定义 和 方程 (10. 18) 中 最 后 的 表达 式 代 人 PB” 的 定义 中 ,并 用 (n - 1) /n 
同时 乘 以 分 式 的 分 子 和 分 母 , 得 到 : 
LY (Z, - Du, 


1 < = 一 
FAA - Zy( X, - X) 


当 重要 概念 10.4 中 的 IV 回归 假设 成 立时 ,B"” 的 大 样本 分 布 


TSLS 估计 量 的 公式 (10. 19) 与 附录 千 3 中 的 OLS 估计 量 的 公式 (4. 51) 类 似 , 只 不 过 分 
子 中 出 现 的 是 Z 而 不 是 XY, 分 母 中 是 Z 和 XX 的 协 方差 而 不 是 XX 的 方差 。 由 于 这 些 相似 性 ， 
以 及 Z 是 外 生 的 ,因此 附录 4.2 中 关于 OLS 估计 量 在 大 样本 条 件 下 服从 正 态 分 布 的 论点 可 


推广 到 Be。 

具体 来 说 , 当 样本 量 很 大 时 ,~pz, 因 此 分 子 大 约 是 3 = ED qo REg = (Z, -pz) 
u 。 因 为 工具 变量 是 外 生 的 ,所 以 B(4,) =0。 根 据 重要 概念 10. 4 中 的 IV 回归 假设 ,q, 是 独 
立 同 分 布 的 ,其 方差 为 go? =var[(Z -pz)u,]。 由 此 得 出 var(4) =o; = os, 而 根据 中 心 极 
限定 理 ,在 大 样本 条 件 下 ,ger ,服从 N(0,1) 分 布 。 

由 于 样本 协 方差 对 总 体 协 方差 是 一 致 的 ,sa 一 >cov( 2, 无 ) ,这 里 的 工具 变量 是 相关 
的 ,因此 cov(2,,X,) 是 非 零 的 。 所 以 ,根据 公式 (10.19) ,Br =p, +q/eov(Z,,X,) ,因此 在 


大 样本 条 件 下 ,85 近似 服从 分 布 NCB, chas) ,其 中 ,oes = gif eos (Z,,X,)]” = (O/a) 
var[ (2 一 ja)w]AEcov(2,,X,)]?, 这 就 是 公式 (10.8) 中 所 给 出 的 表达 式 。 


-附录 10.4， 当 工具 变量 无 效 时 ,TSLS 估计 量 的 大 样本 分 布 - 


本 附录 考虑 当 一 个 或 另 一 个 工具 变量 有 效 性 的 条 件 不 成 立时 ,在 10.1 节 的 结构 (一 个 





BF =p, + (10. 19) 





p. 





X,— Z) F TSLS 估计 量 的 大 样本 分 布 。 如 果 工 具 变 量 相关 性 条 件 不 成 立 ( 即 工具 变量 是 
弱 工 具 变量 ) ,那么 TSL 估计 最 的 大 样本 分 布 不 是 正 态 分 布 ,实际 上 , 它 的 分 布 是 两 个 正 态 
随机 变量 之 比 的 分 布 。 如 果 该 工具 变量 的 外 生性 条 件 不 成 立 , 那 么 TSLS 估计 量 是 不 一 
致 的 。 


当 工 具 变 量 是 弱 工 具 变 量 时 ,BS 的 大 样本 分 布 
首先 考虑 工具 变量 为 不 相关 的 情形 ,有 cov(Z , 工 ) =0。 这样 ,附录 10.3 中 的 变量 必须 
被 0 除 。 为 了 避免 这 个 问题 , 当 总 体 协 方差 为 0 时, 我们 需要 进一步 地 考察 等 式 (10.19) 中 


分 母 的 行为 。 
我 们 重 写 公 式 (10. 19) 。 由 于 在 大 样本 条 件 下 样本 均值 的 一 致 性 ,Z 接近 于 jz,X 接近 


于 jr, 因 此 ,公式 (10. 19) 中 的 分 母 项 近 但 为 上 Y (Z, -ua) (Xz) = EF r, =r, RH 


r= (Z, -uz) (下 =)。 设 只 =var[(2. -pz) (X -pv)] 02 =o2/n, 并 且 设 3,0t 和 gr 为 
附录 10.3 中 所 定义 的 内 容 , 那 么 在 大 样本 条 件 下 ,方程 (10, 19) 隐 合 着 : 


peon s £a (2)(22)-a (NEE coa) 


s; rc; FO; 

如 果 该 工具 变量 是 不 相关 的 ,那么 E(r,) =cov(Z ,X.) =0。 这 样 ,7 就 是 随机 变量 r~ 的 
样本 均值 (根据 第 二 阶段 最 小 二 乘 假 设 ) ,其 中 随机 变量 n ,i = 1,…,n, 是 独立 同 分 布 的 ,有 
FË sval (Z, 一 pz) (X, -u ] (根据 IV 回归 第 三 个 假设 它 是 有 限 的 ) 且 有 零 均值 (由 
于 工具 变量 是 不 相关 的 )。 由 此 得 出 结论 ,中 心 极 限定 理 适 用 于 ,具体 地 讲 ,i/o; 浙 近 服 从 
分 布 N(0,1)。 因 此 ,公式 (10.20) 的 最 后 表达 式 意 味 着 在 大 样本 条 件 下 ,Br - p. 的 分 布 
是 的 as 分 布 ,其 中 a = ever,,$ 是 两 个 随机 变量 之 比 ,其 中 每 个 随机 变量 都 服从 标准 正 态 分 
布 (这 两 个 标准 正 态 随机 变量 是 相关 的 ) 。 

换 名 话说, 当 这 个 工具 变量 不 相关 时 ,中 心 极限 定理 既 适 用 于 TSLS 估计 量 的 分 母 ,也 
适用 于 其 分 子 , 因 此 在 类 样本 条 侍 干 ,TSLS 估计 量 的 分 布 是 两 个 正 态 随机 变量 之 比 的 分 布 。 
F X. 和 是 相关 的 ,所 以 这 些 正 态 随 机 变量 是 相关 的 ,并 且 当 工具 变量 不 相关 时 ,TSLS 
佑 计量 的 大 样本 分 布 很 复杂 。 实 际 上 ,其 有 不 相关 的 工具 变量 的 TL 估计 量 的 大 样本 分 
布 是 以 OLS 估计 量 的 概率 极限 为 中 心 的 。 因 而 , 当 工 具 变量 不 相关 时 ,TSLS 并 没有 消除 
OLS 中 的 偏差 。 此 外 ,TSLS 佑 计量 服从 非 正 态 分 布 ,即便 在 大 样本 条 件 下 。 

当 工 具 变量 是 弱 的 但 并 不 是 不 相关 的 时 ,TSLS 估计 量 的 分 布 仍然 是 非 正 态 分 布 ,因此 ， 
这 里 关于 不 相关 工具 变量 极端 情况 的 一 般 结 论 可 延伸 到 弱 工 具 变节 上 。 例 如 ,我 们 可 以 证 
上 明 ,在 大 样本 条 件 下 ,TSLS 估计 量 抽样 分 布 的 均值 约 等 于 B, + (B -BATEC -1], 其 


中 Bo 是 该 015 估计 量 的 ( 概率) 极限 , 即 应 一 一 8 人“,E(F) 是 第 一 阶段 下 统计 量 的 期 望 。 
这 个 关于 TSLS 估计 量 均值 的 表达 式 是 重要 概念 10.5 中 所 提出 的 弱 工 具 变量 经 验 规则 诊断 
中 切割 值 的 来 源 。 具 体 来 说 ,如 果 EC) = 10 ,那么 相对 于 OLS 的 大 样本 偏差 来 说 ,TSLS 的 
大 样本 偏差 是 179 ,或 刚刚 超过 10% ,在 许多 应 用 中 ,这 是 人 们 可 以 接受 的 一 个 很 小 的 数值 。 


当 工 具 变 量 是 内 生 的 时 ,B" 的 大 样本 分 布 


公式 (10. 19) 最 后 表达 式 中 的 分 子 依 概 率 收 化 于 cov( 2,,u,)。 如 果 该 工具 变量 是 外 生 
的 ,那么 cov(2,,u,) 是 0,TSLS 估计 量 是 一 致 的 {假设 工具 变量 不 是 轮 工具 变量 ) 。 然 而 ,如 








IA 


果 工 具 变 量 不 是 外 生 的 ,那么 在 工具 变量 不 是 弱 工 具 变 量 的 情况 F ,A 
u ) /cov( 2,,) 关 Bl。 也 就 是 说 ,如 果 该 工具 变量 不 是 外 生 的 ,那么 TSLS 估计 量 就 是 不 一 
致 的 。 





一 8， +cov (Z. 








所 讨论 的 ,这 些 威胁 中 的 一 部 分 可 用 回归 方法 ,和 包括“ 差分 再 差分 "估计 量 和 工具 变量 回 沉 
来 解决 或 评估。jt.4 节 运 用 这 些 方法 分 析 了 20 世纪 80 年 伐 后 期 在 田 摧 西 州 的 一 个 随机 
化 控制 实验 。 在 该 实验 中 ,小 学 生 被 随机 地 分 配 到 不 同 规模 的 班级 中 去 。 

11.5 节 转 向 准 实验 的 讨论 和 如 何 使 用 准 实验 估计 因果 效应 。 对 准 实验 有 效 性 的 威 腑 
在 16 节 中 讨论 ， 在 实验 和 准 实验 中 都 可 能 出 现 的 一 个 问题 是 ,处 理 艾 应 在 同一 总 体 中 的 
不 同 成 员 之 间 可 能 不 同 。 当 总 体 是 异 质 的 时 ,对 因果 效应 相应 的 估计 秆 如 何 解 释 的 问题 ,将 
在 11.7 节 中 讨论 。 


-11.1 理想 化 实验 和 因果 效应 


回想 一 下 1.2 节 中 的 内 容 ,一 项 随机 化 控制 实验 将 随机 地 从 所 研究 的 总 体 中 选择 主体 
(个 体 ,或 更 一 般 地 讲 , 实 体 ) ,然后 随机 地 将 他 们 分 配 到 接受 实验 处 理 的 处 理 组 中 去 ,或 不 
接受 处 理 的 控制 组 中 去 。 该 项 处 理 的 因果 效应 就 是 在 理想 的 随机 化 控制 实验 中 所 测度 的 对 
所 研究 的 处 理 产 生 结果 的 期 望 效应 。 


11.1.1 理想 的 随机 化 控制 实验 


起 初 ,人 们 可 能 认为 理想 的 实验 就 是 到 两 个 各 个 方面 都 相同 的 个 体 ,处 理 他 们 中 的 一 
个 ,并 在 保持 其 他 所 有 影响 都 不 变 的 情况 下 比较 他 们 结果 的 差异 性 。 不 过 ,这 并 不 是 一 个 实 
际 的 实验 设计 ,因为 不 可 能 找到 两 个 同样 的 个 体 。 即 使 是 完全 相同 的 双胞胎 ,各 自 也 会 有 不 
同 的 生活 经历 ,因此 他 们 不 是 在 每 个 方面 都 相同 的 。 

一 个 理想 的 随机 化 控制 实验 的 中 心思 想 就 是 ,可 以 通过 从 一 个 总 体 中 随机 地 选择 个 体 ， 
然后 对 一 些 个 体 随机 地 施行 处 理 , 进 面 测度 因果 效应 。 如 果 处 理 是 随机 分 配 的 ,例如 ,通过 
投掷 硬币 或 通过 使 用 计算 机 的 随机 数 发 生 器 ,那么 该 处 理 的 水 平 独立 分 布 于 对 结果 的 任何 
其 他 决定 性 因素 之 中 ,由 此 便 消 除了 遗漏 变量 偏差 { 苑 重要 概念 5.1) 的 可 能 性 。 鲍 如 ,假设 
个 人 被 随 机 地 分 配 参 加 一 项 工作 培训 项 目 ,在 该 培训 项 目 结束 后 ,一 个 人 以 前 的 工作 经 验 将 
影响 他 (或 她 ) 获得 工作 的 机 会 ,但 是 只 要 该 工作 培训 项 目 (“ 处 理 ") 中 的 参加 者 是 随机 分 
配 的 ,那么 工作 经 验 的 分 布 在 处 理 组 和 控制 组 之 同 就 是 一 样 的 ,也 就 是 说 ,参与 工作 培训 是 
独立 分 布 于 以 前 的 工作 经 验 的 。 因 此 ,参与 同 以 前 的 工作 经 验 是 不 相关 的 ,在 分 析 中 忽略 以 
前 的 工作 经 验 ,将 不 会 使 培训 项 目 对 将 来 就 业 效 应 的 佑 计量 产生 遗漏 变量 偏差 。 

随机 分 配 的 作用 可 以 用 单个 因子 回归 模型 来 重新 表述 ， 

Y, =Ë, +B, X, +u, (11.1) 
EPX 是 处 理 的 水 平 ,和 通常 一 样 ,i, 包含 了 结果 Y, 的 所 有 其 他 的 决定 性 因素 。 如 果 处 理 
对 处 理 组 的 所 有 成 员 都 是 一 样 的 ,那么 大 就 是 二 元 变量 。 其 中 ,X, =1 表示 第 i 个 个 体 接受 
了 处 理 ;X =0 表示 他 (或 她 ) 没 有 接受 处 理 。 如 果 处 理 的 水 平 在 处 理 组 的 个 体 间 有 变化 , 那 
A X, 就 是 接受 处 理 的 水 平 。 例 如 ,站 可 能 是 药 的 剂量 或 一 项 工作 培训 项 目的 周 数 ,其 中 ,如 
果 没 有 接受 处 理 { 药 的 剂量 为 0) ,那么 天 =0, WE X 是 二 元 变量 ,那么 公式 (11. 1 ) 中 的 线 
性 回归 函数 就 不 会 施加 函数 形式 约束 。 如 果 半 能 取 多 个 值 ,那么 公式 (11. 1) 就 会 把 总 体 回 
归 函 数 看 做 是 线性 的 ( 非 线性 问题 可 用 6.2 节 的 方法 加 以 解决 ) 。 

MR X 是 随机 分 配 的 ,那么 马 独立 分 布 于 中 的 遗漏 因素 。 由 于 这 些 遗 汗 因 素 与 X, 
是 独立 分 布 的 ,因此 在 公式 (11.1) 中 ,E(Y1X) =Bo +X BA AE X, F ,u, 的 条 
件 均值 不 依赖 于 , 妈 (wu,1X,) =-0。 这 样 ,X 的 随机 分 配 意味 着 ,具有 单个 回归 因子 的 回 











妇 模型 中 的 第 一 个 最 小 二 乘 假设 ( 见 重 要 概念 4. 3) 自动 成 立 。 

内 求 获 必 。 多 理 水 平 二 对 了 的 因果 效应 ( casual effect) 就 是 条 件 期 望 之 差 , 即 E(YIX 
=x) -E(YIX=0) ,其 中 天 (YIX=%) 是 在 一 个 理想 的 随机 化 实验 中 收 到 处 理 水 平 * 的 处 理 
组 中 了 的 期 望 值 ,而 五 (了 天 =0) 是 控制 组 中 了 的 期 望 值 。 就 实验 来 说 , 因果 效应 也 被 称 为 
处 理 效应 (treatment effect), m FEINA, EZAC 1)P E(u 1X) =0, 因 此 ,公式 
(11,1) 中 的 B, 就 是 用 处 理 组 和 控制 组 之 疝 结果 的 期 望 值 之 差 所 测度 的 下 单位 变化 的 因果 
效应 。 


11.1.2 差分 估计 量 


因果 效应 是 期 望 值 之 差 ,因而 它 是 一 个 未 知 的 总 体 特征 。 因 果 效 应 可 以 用 取 自 随机 化 
控制 实验 的 数据 进行 秆 计 。 假 设 处 理 X, 是 二 元 变量 ,由 于 这 里 的 处 理 是 随机 分 配 的 ,因此 
因果 效应 可 用 处 理 组 和 控制 组 之 间 的 样本 平均 结果 之 盖 来 估计 。 同 理 , 如 在 4. 7 节 中 所 讨 
论 的 ,Bl 可 用 对 回归 的 OLS HHE B, 进行 估计 。 由 于 在 公式 (11.1) 中 E(w lX) = 
0, 因 此 应 是 无 偏 的 。 我 们 把 了 对 X, 回归 的 OLS AHE A 称 为 差分 估计 量 ( differences 
estimator} , 当 处 理 是 二 元 变量 时 , 它 是 处 理 组 的 样本 平均 结果 和 控制 组 的 样本 平均 结果 
之 差 。 

通过 随机 地 分 配 处 理 ,一 个 理想 的 随机 化 控制 实验 消除 了 处 理 蕊 和 误差 项 之 间 的 
相关 关系 ,所 以 差分 佑 计量 是 无 偏 的 且 一 致 的 。 然 责 在 实践 中 ,现实 的 实验 与 理想 的 实验 总 
是 有 偏离 ,于 是 就 会 出 现 和 之 间 相 关 性 的 问题 。 


Ll.2 现实 中 的 实验 存在 的 潜在 问题 - 


回忆 一 下 重要 概念 7. 1 ,如 果 一 项 关于 因果 效应 的 统计 推断 对 所 研究 的 总 体 是 有 效 的 ， 
那么 就 称 该 项 统计 研究 是 内 部 有 效 的 ;如 果 它 的 推断 和 结论 能 够 从 所 研究 的 总 体 和 环境 中 
推广 到 其 他 的 总 体 和 环境 中 ,那么 该 项 统计 研究 就 是 外 部 有 效 的 。 各 种 现实 世界 中 的 问题 
向 以 人 为 主体 的 实际 实验 统计 分 析 的 内 部 和 外 部 有 效 性 提出 了 威胁 。 


11.2.1 对 内 部 有 效 性 的 威胁 


对 一 项 随机 化 控制 实验 内 部 有 效 性 的 威胁 包括 瑚 机 化 的 失败 .没有 遵守 处 理 协 议 . 损 
失 ,实验 效应 和 小 样本 容量 。 

随机 化 的 失败 。 处 理 组 和 控制 组 的 随机 分 配 是 随机 化 控制 实验 的 基本 特征 , 它 使 估计 
因果 效应 成 为 可 能 。 如 果 处 理 不 是 随机 分 配 的 ,相反 ,而 是 部 分 地 以 主体 的 特征 或 偏好 为 基 
础 ,那么 实验 的 结果 反映 的 既是 处 理 效应 ,也 是 非 随机 分 配 效应 。 例 如 ,假设 在 一 项 工作 培 
训 项 目 实验 中 ,参加 者 被 分 配 到 处 理 组 的 依据 是 他 们 的 姓 是 否 排 在 前 一 半 字 母 中 或 后 一 半 
字母 中 。 由 于 姓 的 不 同 在 一 定 程度 上 反映 了 种 族 的 差异 ,因此 在 处 理 组 和 控制 组 之 间 种 族 
的 差别 可 能 系统 地 不 同 。 由 于 种 族 之 间 在 工作 经 验 受 教育 程度 以 及 其 他 劳动 力 市 场 特征 
方面 是 不 同 的 ,因此 ,在 这 些 能 够 影响 实验 结果 的 遗漏 因 素 中 , 处理 组 和 控制 组 之 间 可 能 存 
在 系统 差异 。 

更 一 般 地 说 , 非 随机 化 分 配 会 导致 处 理 X, 和 误差 项 之 间 的 相关 ,因为 是 否 接受 处 理 部 
分 地 是 由 进 人 误差 项 的 个 体 特 征 决定 的 。 因 此 一 般 来 说 , 非 随机 化 分 配 会 使 差分 估计 量 产 








在 条 差 ,需要 根据 实验 所 评估 的 对 象 以 及 如 何 热 行 实验 的 细节 进行 判断 。 

小 样本 ”由 于 以 人 为 主体 的 实验 可 能 是 很 兄 贵 的 ,因此 有 时 样本 容量 很 小 。 一 个 小 容 
量 的 样本 不 会 使 因果 效应 的 估计 量 产生 偏差 ,但 是 这 确实 意味 着 因果 效应 不 能 被 精确 地 
估计 。 


一 般 兴 趣 杠 


Hawthorne 效应 

在 2 世纪 20 年 代 和 30 年代 期 间 , 通 用 电气 公司 在 他 们 的 Hawthome 工厂 进行 了 一 系 
列 关 于 工人 生产 效率 的 研究 。 在 一 组 实验 中 ,他 们 通过 改变 电灯 瓦特 数 来 了 解 灯光 如 何 影 
响 妇 工装 备 电器 部 件 的 生产 效率 。 在 其 他 一 些 实验 中 ,他 们 增加 或 减少 了 休息 时 间 ,改变 了 
车 间 设 计 , 缩 得 了 工作 日 。 关 于 这 些 研 究 的 一 些 早 期 很 有 影响 的 结论 得 出 ,不 论 灯 光 是 更 强 
还 是 更 弱 , 劳动 日 是 更 长 还 是 更 得 ,工作 条 件 是 改善 还 是 恶化 ,生产 效率 都 继续 上 升 。 研 究 
人 员 断 言 ,生产 效率 的 提高 不 是 因为 车 合 的 变化 ,而 是 因为 在 实验 中 工人 的 特殊 和 衣 色 使 他 们 
感觉 受到 重视 和 有 价值 ,所 以 他 们 工作 越 来 越 努 力 , 这 才 导 致 了 生产 效率 的 提高 。 过 了 许多 
年 ,自身 在 一 项 实验 中 会 影响 主体 的 行为 这 一 思想 ,逐渐 变 成 了 Hawthorne 效应 。 

但 是 ,这 个 故事 还 有 个 问题 ;仔细 研究 实际 的 Hawthome 数据 表明 ,Hawthome 效应 并 不 
存在 ( Gillespie,1991;Jones,1992) ! 在 一 些 实验 中 ,尤其 在 主体 对 结果 有 重要 影响 的 实验 
中 ,仅仅 处 于 一 项 实验 之 中 就 会 影响 其 行为 。 更 一 般 地 说 ,Hawthore 效应 和 实验 效应 对 内 
部 有 效 性 造成 了 威胁 ,即使 在 最 初 的 Hawthome 数据 中 ,Hawthorne 效应 并 不 明显 。 


11,2.2 对 外 部 有 效 性 的 威胁 


对 外 部 有 效 性 的 威胁 ,减弱 了 将 研究 的 结论 推广 到 其 他 总 体 和 环境 中 去 的 能 力 。 有 两 
个 这 样 的 威胁 :一 个 是 当 实 验 样 本 不 是 所 档 究 总 体 的 代表 时 ,会 产生 这 样 大 的 威胁 ; 另 一 个 
是 被 研究 的 处 理 不 是 将 被 更 广泛 执行 的 处 理 的 代表 时 ,也 会 产生 这 样 的 威胁 。 

非 代 表 性 样本 。 所 研究 的 总 休 和 感 兴 趣 的 总 体 必须 足够 地 相似 ,以 保证 实验 结论 的 推 
广 是 合理 的 。 如 果 一 个 工作 培训 项 目 实验 中 含有 刑 满 释放 人 员 ,那么 对 这 样 的 项 县 进行 评 
估 , 将 所 研究 的 结论 推广 到 其 他 的 刑 满 释放 人 员 中 是 可 能 的 。 然 而 ,由 于 潜在 的 诬 主 对 犯罪 
记录 看 得 很 重 ,因此 该 项 结论 也 许 不 宜 推 广 到 从 未 犯罪 的 工大 中 。 

非 代表 性 样本 的 另 一 个 例子 是 , 当 实 验 参加 者 是 志愿 者 时 ,就 会 出 现 非 代表 性 样本 的 情 
形 。 即 使 志愿 者 是 被 随机 地 分 配 到 处 理 组 和 控制 组 中 ,这 些 志 愿 者 也 可 能 比 整个 名 体 的 成 
员 更 积极 ,而 对 他 们 而 言 ,处 理 可 能 会 产生 更 大 的 效应 。 更 一 般 地 说 ,从 一 个 更 大 的 我 们 所 
感 兴趣 的 总 体 中 非 随机 地 选择 样本 ,可 以 减弱 我 们 将 从 所 研究 的 总 体 ( 例 如 志愿 者 ) 中 得 出 
的 结论 推广 到 我 们 感 兴趣 的 总 体 中 的 能 力 。 

非 代 表 性 项 目 或 政策 、 我 们 所 感 兴趣 的 政策 或 项 目 也 必须 与 我 们 所 研究 的 项 目 足 够 地 
相似 ,以 允许 我 们 将 结论 正确 地 推广 。 一 个 重要 的 特征 是 ,小 规模 的 .被 严格 监管 的 实验 项 
目 , 可 能 会 非常 不 同 于 将 来 实际 执行 的 项 目 。 如 果实 际 执行 的 项 县 是 可 以 广泛 得 到 的 ,那么 
一 个 规模 将 增 大 的 项 目 不 可 能 提供 与 实验 形式 相同 的 质量 控制 ,或 者 只 能 在 一 个 较 低 的 水 
平 上 得 到 资助 。 当 一 个 完全 规模 的 项 目 比 一 个 较 小 规模 的 实验 项 目 效率 更 低 时 ,也 会 产生 
同样 的 可 能 性 。 一 项 实验 项 目 和 一 项 实际 项 目 之 闻 的 另 一 个 差异 是 它们 的 持续 时 间 : 实 验 
项 目 只 持续 实验 期 那么 长 ,而 所 考虑 的 实际 项 目 可 能 会 持续 更 长 的 时 间 。 

一 般 均 黎 效 应 ， 与 规模 和 持续 时 间 有 关 的 一 个 问题 ,涉及 经 济 学 家 们 所 称 的 “一 般 均 








衡 " 效应。 把 一 个 小 的 ,临时 性 的 实验 项 目 变 成 一 个 广泛 的 .持久 的 项 目 , 可 能 要 完全 地 改 
变 实验 结论 不 能 被 推广 的 那些 经 济 环境 。 例 如 ,一 个 规模 小 的 、 实 验 性 的 工作 培训 项 自 可 能 
由 雇主 来 提供 ,但 是 如 果 该 项 目 变 得 广泛 且 可 获得 ,那么 它 会 取代 雇主 所 提供 的 培训 ,从 而 
降低 了 该 项 目的 净利 益 。 同 样 , 一 项 普遍 实行 的 教育 改革 ,例如 学 校 大 幅度 降低 班级 规模 ， 
能 够 增加 教师 的 需求 并 改变 被 吸引 去 教书 的 人 的 类 型 ,因此 该 项 全 面 改 革 最 终 的 净 效 应 将 
反映 在 学 校 人 员 的 这 些 被 迫 的 变化 上 。 用 经 济 计量 学 的 术语 表达 ,在 保持 市 场 或 政策 环境 
不 变 的 情况 下 ,一 项 内 部 有 效 的 小 实验 可 能 会 正确 地 测量 因果 效应 ,但 是 一 般 均 衡 效 应 意味 
着 , 当 该 项 目 被 广泛 地 执行 时 ,这 些 其 他 的 因素 实际 上 并 不 是 保持 不 变 的 。 

处 理 和 资格 效应 。 用 于 在 更 一 般 的 经 济 学 和 社会 项 目 中 ,一 个 实际 { 非 实验 的 ) 项 目的 
参加 者 通常 是 自愿 的 ,因此 出 现 了 对 外 部 有 效 性 的 另 一 个 威胁 。 这 样 , 当 实际 执行 项 目的 参 
加 者 被 允许 决定 自由 参加 时 ,测度 该 项 目 对 随机 选择 的 总 体 成 员 效应 的 一 项 实验 研究 ,一般 
不 会 提供 对 该 项 目 效 应 的 一 个 无 偏 估 计量 。 一 个 工作 培训 项 目 可 能 对 已 选择 参加 的 少数 人 
是 很 有 效 的 ,而 对 从 总 体 中 随机 选择 的 成 员 来 说 可 能 是 相对 无 效 的 。 解 决 这 个 问题 的 一 个 
方法 是 ,把 所 要 做 的 实验 设计 成 尽 可 能 地 与 该 项 目 将 被 执行 的 现实 相 吻 合 。 例 如 ,如 果 现 实 
中 的 工作 培训 项 目 对 于 符合 某 一 收入 标准 值 的 任何 个 人 来 说 均 可 获得 ,那么 该 项 实验 协议 
可 采用 一 个 相似 的 规则 :被 随机 选择 的 处 理 组 会 被 给 予 符合 项 目 资格 的 “处 理 ”, 而 控制 组 
由 于 不 符合 项 目 资格 而 不 被 给 予 “ 处 理 "。 在 此 情形 下 ,所 得 的 差分 估计 量 将 会 估计 出 符合 
项 目 资格 那些 人 的 效应 , 它 和 从 这 样 的 一 个 工作 培训 项 上 自 中 所 估计 出 的 处 理 效应 是 不 同 的 ， 
该 项 目 是 从 一 个 够 资格 的 总 体 中 随机 地 选择 成 员 。 


1.3 使 用 实验 数据 的 因果 效应 的 回归 估计 量 ) 


在 带 有 二 元 处 理 变量 的 一 个 理想 的 随机 化 控制 实验 中 , 因果 效应 可 以 用 差分 估计 量 来 
估计 , 即 由 公式 (11. 1) 中 8 的 OLS 估计 量 进 行 和 合计。 如果 处 理 是 被 随机 地 接受 的 ,那么 差 
分 估计 量 就 是 无 偏 的 , 伺 它 却 不 一 定 是 有 效 的 。 此 外 ,如 果 在 11.2 节 中 所 讨论 的 一 些 实际 
实验 中 的 问题 出 现 了 ,那么 X, 入 是 相关 的 ,因此 房 是 有 偏 的 。 

本 节 提 出 了 其 他 一 些 用 于 分 析 实 验 数据 的 基于 回归 分 析 的 方法 ,目的 就 是 当 处 理 被 随 
机 地 接受 时 ,获得 比 差 分 估计 量 更 有 效 的 估计 量 ; 且 当 内 部 有 效 性 的 某 种 威胁 因素 存在 时 ， 
获得 一 个 无 偏 的 或 至 少 是 一 致 的 因果 效应 估计 量 。 本 节 以 如 何 检验 随机 化 的 讨论 作为 
结束 。 


11.3.1 带 有 额外 回归 因子 的 差分 估计 量 


通常 可 获得 与 决定 实验 结果 有 关 的 主体 其 他 特征 的 数据 。 例 如 , 由 于 收入 依赖 于 以 前 
的 教育 ,因此 在 一 项 实验 性 的 工作 培训 项 目 中 ,收入 评价 既 依 赖 于 以 前 的 教育 ,又 依赖 于 工 
作 培训 项 是 本身 。 在 一 项 医药 检验 中 , 除 药物 治疗 本 身 之 外 ,健康 的 结果 可 能 会 依赖 于 病人 
的 特征 ,例如 年 龄 .体重 ,性 别 以 及 先前 存在 的 医疗 条 件 。 假 设 下 ,,… ,到 ,代表 测度 样本 中 
第 i 个 个 体 的 r 个 个 别 特 征 的 变量 ,其 中 ,这 些 个 别 的 特征 并 不 受 处 理 的 影响 {参加 工作 培 
训 项 目 并 不 改变 你 以 前 的 教育 程度 ) 。 除 了 处 理 蒜 之 外 ,如 果 这 些 个 体 特征 是 决定 结果 了 
的 一 个 因素 ,那么 这 些 变 量 隐 舍 在 公式 (11.1) 的 误差 项 中 。 因 此 ,可 以 对 公式 (11.1) 进 行 
修改 ,以 使 这 些 特征 明确 地 进 人 到 回归 中 。 假 设 这 些 特征 以 线性 方式 进 人 ,这 就 生成 了 多 元 
问 归 模 型 : 








Yi =B + +B, +- +B... W +u, =l pen (11.23 
公式 (11.2) 中 pi 的 OLS 估计 量 就 是 带 有 额外 回归 因子 的 差分 估计 量 ( difference 
estimator with additional regressors) o 

ARRANA FII A AeA - 敏 性 ,如 果 客 元 回归 的 虽 个 最 小 二 乘 假 设 成 立 
( 见 重 要 概念 5. 4) ,那么 公式 (11.2) 中 所 有 系数 的 OLS 佑 计量 都 是 无 癸 的 且 一 致 的 ,而 且 
构成 了 统计 推断 的 有 效 基 础 。 

在 一 些 应 用 中 ,第 一 个 最 小 一 乘 假设 ECu X, W... W.) =0 并 不 是 必需 的 。 例 如 ， 
邵 果 更 的 器 归 因子 之 一 是 以 前 的 教育 ,那么 它 可 能 与 进入 中 的 难以 观测 的 个 人 能 力 见 
关 。 不 过 ,在 一 个 比 通 常 的 条 件 零 均值 假设 更 弱 的 假设 条 件 下 , 带 有 额外 回归 因子 的 差分 估 
计量 是 一 致 的 。 具 体 来 说 ,这 个 更 弱 的 假设 又 被 称 为 条 件 均 值 独 立 性 (conditional mean 
independence) 假 设 , 它 的 数学 表达 式 在 附录 11.3 中 给 出 。 简 而 言 之 ,条 件 均 值 独立 性 要 
sk BE X, 和 变量 四 的 条 件 下 ,zx 的 条 件 均值 不 依赖 于 天 ,尽管 它 可 能 依赖 于 变量 W, 

有 两 种 重要 的 情形 ,其 中 ,尽管 在 变量 外 利 & 之 同 有 相关 关系 ,但 是 条 人 忻 均 值 独立 性 成 
立 ,而 且 带 有 额外 回归 因子 的 差分 估计 量 是 一 致 的 (即使 四 变量 系数 的 OLS 佑 计量 通常 是 
不 一 致 的 ) 。 第 一 种 情形 是 当 处 理 被 随机 地 分 配 时 ,X, 和 所 有 的 个 体 特 征 不 相关 ,要 么 包括 
在 回归 (变量 下 中 ,要 人 么 排除 在 回归 之 外 (在 误差 项 中 ) ,因此 ,XX 不 能 “截取 ”任何 个 体 特 
征 的 效应 ,不 论 个 体 特征 是 包括 在 回归 中 还 是 不 包括 在 回归 中 。 第 二 种 情形 是 已 知 W. ,不 
被 有 条 件 地 随机 分 配 时 ,天 被 随机 地 分 配 ,但 是 否 被 分 配 到 处 理 组 中 的 概率 依赖 于 W 
如 ,假设 一 个 工作 培训 项 目 中 的 参加 者 被 分 成 两 组 ,高 中 毕业 的 参加 者 分 为 一 组 ,高 中 没 毕 
业 的 参加 者 分 为 一 组 。 在 高 中 毕业 的 参加 者 中 ,有 30 旬 的 人 被 随机 地 分 瑟 到 处 理 组 ,个 是 
在 离 中 没 毕 业 的 参加 者 中 ,70 名 的 人 被 随机 地 分 衣 到 处 理 组 。 由 于 每 个 毕业 生 有 相同 的 机 
会 被 分 配 到 处 理 组 ,因此 对 处 理 组 和 控制 组 中 的 高 中 毕业 生 而 言 ,u, 的 均值 是 一 样 的 。 同 
样 道理 ,对 外 理 组 和 控制 组 中 的 非 高 中 毕业 生 而 言 ,wu 的 均值 也 是 一 样 的 。 不 过 , 的 均值 
对 高 中 毕业 生 和 非 高 中 毕业 生 通 常会 不 同 (毕业 与 遗漏 变量 即 能 力 和 动机 相关 ) 。 在 这 种 
情况 下 X, 是 条 件 随 机 的 (给 定 毕 业 状态 W, RIEF X, 被 随机 地 分 配 ) WR X 是 条 件 随 
机 的 ,那么 就 如 在 附录 11.3 中 所 进一步 讨论 的 ,条 件 均 值 独立 性 成 立 ,而 且 具 有 额外 回归 因 
子 的 差分 估计 量 是 一 致 的 。 

重要 的 是 ,公式 (11.2) 中 的 回归 因子 W. 不 是 实验 性 结果 ;否则 ,及 是 内 生 的 。 例 如 , 假 
设 是 在 十 作 培训 项 目 之 后 的 收入 , 殉 , 代表 在 该 项 目 结束 之 后 得 到 的 一 项 工作 ,而 ,表示 
处 理 。 如 果 未 来 的 就 业 状 态 被 包含 在 这 个 回归 中 ,那么 XX 的 系数 就 不 再 是 该 项 目的 效应 
了 ,更 确切 地 说 ,在 保持 未 来 就 业 不 变 的 情况 下 , 它 是 该 项 目的 遍 部 效应 。 此 外 ,未 来 的 就 业 
可 能 与 半 相关 (该 项 目 导致 获得 了 工作 ) ,也 可 能 和 误差 项 相关 (更 有 能 力 的 受 培 训 人 员 得 
到 了 工作 ) 。 因 此 ,在 公式 (11.2) 中 ,我 们 将 注意 力 集中 在 变量 和 上 ,该 变量 测量 了 预先 处 
理 的 特征 ,而 医 先 处 理 的 特征 不 受 实验 性 处 理 的 影响 。 

带 有 额外 回 则 因子 时 使 用 差分 估计 量 的 理由 ,, 使 用 这 个 统计 量 存 在 三 个 理由 : 

L 有 效 性 。 如 果 处 理 被 随机 地 分 配 ,那么 ,多 元 回归 模型 (会 式 ( 霸 . 2 中 忆 的 OLS 
估计 量 比 单个 回归 因子 模型 (公式 (11.1) ) 中 的 OLS 佑 计量 更 有 效 ( 有 更 小 的 方差 ) 。 理 由 
是 ,公式 (11.2) 中 引入 额外 的 决定 了 的 因素 降低 了 误差 项 的 方差 ( 见 练习 16.7). 

2、 随 机 化 的 检查 。 如 果 处 理 不 是 被 随机 分 配 的 ,尤其 是 以 与 下 有 关 的 方式 分 配 的 , 那 
么 差分 估计 量 ( 公 式 (11. 1) ) 则 是 不 一 致 的 ,而 且 一 般 来 说 与 具有 额外 回归 因子 的 差分 估计 
量 (公式 (11. 2) ) 的 概率 极限 也 不 相同 。 这 两 个 OLS 估计 值 之 间 较 大 的 差异 表明 ,%, 实际 








(1.4 Elu 1 X.) =0, 那 么 相应 的 车 分 估计 量 是 有 储 的 ,但 差分 再 差分 估计 量 却 不 是 有 偏 
BJ, Bl 11 一 1 就 说 明了 这 一 点 。 在 这 个 图 中 ,在 实验 前 处 理 组 了 的 样本 均值 是 4 ,而 该 控 
制 组 了 的 预先 处 理 样本 均值 是 20。 在 实验 期 间 , 控制 组 中 了 的 样本 均值 增加 到 30 ,而 处 理 
组 中 了 的 样本 均值 增加 到 80。 因 此 ,处 理 后 样本 平均 数 的 均值 之 差 是 80 ~30 =50。 然 而 ， 
茶 些 差异 是 由 于 处 理 组 和 控制 组 有 不 同 的 预 完 处 理 均值 而 产生 的 :处 理 组 开始 就 领先 于 控 
制 组 。 人 秽 子 中 所 得 的 差分 再 差分 人 知 计 量 测 量 了 相对 于 榨 制 组 来 说 处 理 组 的 增 量 ,在 这 个 人 饥 
子 中 它 是 (80 - 40) - (30 -20) =30。 更 一 般 地 说 ,通过 集中 研究 实验 期 间 了 的 变化 ,所 得 
的 差分 再 差分 估计 量 消除 了 在 处 理 组 和 控制 组 之 间 系 统 地 变化 的 了 的 初始 值 的 影响 。 
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注 : 处 理 组 和 控制 组 处 理 后 之 养 是 中 - 30 = 和 ,但 是 这 夺 大 了 处 理 效 应 ,因为 在 处 理 之 前 ,处 理 组 
的 了 比 控制 组 高 40 -20 =20。 差 分 再 差分 估计 量 是 最 终 的 和 初始 的 差距 之 差 , 因 此 房 % = (80 - 
30) - (40 -20) = 和 -20=30。 间 理 ,差分 再 差分 估计 量 是 处 理 组 的 平均 变化 减 去 控制 组 的 平均 变化 ， 
BA A P A F = (80 —40) - (30 —20) =30, 
图 11 一 ! ”差分 再 差分 估计 量 
带 有 额外 回归 因子 的 兰 分 冉 差分 佑 计量。 差分 再 差分 估计 量 可 被 扩展 到 包括 额外 的 回 
HAF 可 ,pw… 罗 ,这 些 回归 因子 测量 了 实验 前 的 合体 特征 。 例 如 ,在 一 个 工作 培训 项 目的 
评价 中 ,是 收入 ,变量 到 之 一 可 以 是 参加 者 前 置 的 教育 水 平 。 这 些 阁 外 的 回归 因子 可 用 
多 元 回归 模型 来 把 它们 放 到 一 起 刻画 ; 
AY, =& +B X. +h Wi + +Bñ.,W. +u,, alpen (11.5) 
ARLS) Fe, 的 OLS 估计 量 就 是 我 们 所 说 的 带 有 额外 回归 因子 的 差分 再 差分 估计 
E differences-in-dfferences estimator with additional regressors} 。 如 果 X 基 被 随机 分 


配 的 ,那么 公式 (11.5) 中 房 的 OLS 估计 量 就 是 无 偏 的 。 

公式 {11.5) 中 包括 额外 的 回归 因子 W 的 理由 ,与 公式 (11,2) 中 包 揪 它们 的 三 个 理由 
是 一 样 的 。 公 式 (11.2) 只 使 用 了 处 理 后 的 数据 ,如 果子. 被 随机 地 分 配 ,那么 包括 额外 回归 
因子 能 够 改善 有 效 性 ;通过 增加 回归 因子 ,还 可 以 检查 戎 机 性 ; 通过 增加 回归 因子 允许 对 条 
件 随 机 性 进行 调整 ,条 件 随机 性 即 依赖 于 可 观测 变量 的 随机 性 。 重 要 的 是 ,就 如 在 公式 
(11.2) 的 上 下 文中 所 讨论 的 ,变量 下 不 包括 那些 实验 结果 就 是 它们 本 身 的 变量 。 

公式 (11.5) 中 变量 W 的 解释 不 同 于 在 具有 额外 回归 因子 的 差分 估计 量 公式 (公式 
(11.2)) 中 的 解释 。 看 公式 (11.2) 中 ,因为 只 比 较 处 理 后 的 结果 ,所 以 变量 VERT Y, 的 














水 平 差异 。 相 反 ,在 会 式 (11.5) 中 ,变量 玉 解 释 了 整个 实验 期 间 Y, 的 变化 的 差异 。 在 工作 
培训 项 目的 那个 例子 中 ,公式 (11.5) 中 的 因 变 量 是 实验 期 间 收 人 的 变化 ,和 表示 参加 者 是 
审 在 处 理 组 中 ,而 W. 可 能 是 前 置 的 教育 水 平 。 这 个 回归 把 前 置 教育 水 平 因素 包括 进来 , 考 
虑 了 实验 期 间 具 有 更 高 前 置 教育 水 平 的 个 体 倾 向 于 有 更 大 的 收入 变化 的 可 能 性 ,不 论 他 们 
是 在 处 理 组 中 还 是 在 控制 组 中 。 

其 分 再 闫 分 估计 芭 推 广 到 多 期 ， 在 一 些 实验 中 ,个 体 被 观测 多 个 时 期 ,而 不 止 两 期 。 在 
一 需 工作 培训 项 目 实 验 中 ,个 体 的 收入 和 就 业 状况 可 能 按 月 度 被 观测 了 -年 或 多 年 。 在 此 
情形 下 ,以 单个 预先 处 理 观测 秆 和 单个 处 理 后 观测 值 之 间 结 果 的 变化 为 基础 的 公式 (11. 4) 
和 公式 (11.35) 中 的 总 体 问 归 模 型 是 不 适合 的 。 然 而 ,这 样 的 数据 可 用 8.3 节 的 固定 效 立 回 
归 模 型 进行 分 析 ,附录 11.2 提供 了 分 析 的 细节 。 


11.3.3 不 同 组 的 因果 效应 佑 计 


因果 效应 在 不 同 主体 之 间 可 能 是 不 同 的 ,这 依赖 于 个 体 的 特征 。 鲍 如 ,降低 胆 固 羡 的 药 
对 胆固醇 水 平 的 影响 对 高 胆 贰 莅 含 量 的 病人 可 能 要 比 对 低 胆 固 枚 含量 的 病人 大 。 同 样 道 
理 , 一 个 工作 培训 项 目 对 女人 可 能 比 对 男人 更 有 效 ,而 且 它 对 更 积极 的 主体 可 能 比 对 不 太 积 
极 的 主体 更 有 效 。 更 一 般 地 说 ,因果 效应 会 依赖 于 一 个 或 多 个 变量 的 值 , 这 些 变量 可 能 被 观 
测 到 (如 性 别 ) ,也 可 能 不 被 观测 到 (如 积极 性 ) 。 

依赖 于 一 个 可 观测 变量 值 (如 下 ) 的 因果 效应 ,可 通过 分 析 处 理 变量 工 与 公式 (11.2) 
(具有 额外 回归 因子 的 差分 估计 量 } 中 或 公式 (11.5){ 具 有 额外 回归 因子 的 差分 再 差分 估计 
Bi) W. 之 间 的 交互 作用 进行 估计 。 例 如 ,如 果 F, 是 二 元 变量 ,那么 这 个 相互 作用 的 设 定 
允许 我 们 对 与 两 个 不 同 的 家 值 相对 应 的 两 个 不 同 组 的 处 理 效应 进行 估计。 更 一 般 地 说 , 依 
加 于 一 个 可 观测 回归 因子 的 因果 效应 的 估计 ,是 6.3 节 中 我 们 所 讨论 的 交互 作用 方法 的 一 
个 应 用 。 

当 因 果 效 应 依赖 于 一 个 不 可 观测 的 变量 值 时 ,解释 因果 效应 估计 值 的 讨论 主题 将 在 
11.7 节 中 进行 研究 。 


11.3.4 存在 局 部 依从 性 时 的 估计 


如 果 存 在 对 所 用 实验 协议 的 局 部 依从 性 ,那么 处 理 水 平 可 能 与 那个 不 可 观测 的 个 体 
特征 相关 ,而 且 到 目前 为 止 我 们 所 讨论 的 OLS 估计 量 都 是 不 一 致 的 。 例 如 ,如 果 只 有 最 
积极 的 那个 接受 培训 的 人 出 席 了 工作 培训 项 目 , 那 么 该 工作 培训 项 目 可 能 看 上 去 是 有 效 的 ， 
但 只 因为 受 培 训 的 人 是 最 努力 的 工人 ,所 以 不 管 他 们 是 否 参加 该 培训 项 目 ,他 们 在 劳动 力 市 
场 上 都 会 做 得 很 好 。 | 

如 在 第 10 章 中 所 讨论 的 ,假设 存在 一 个 可 获得 的 工具 变量 ,那么 工具 变量 回归 为 一 个 
回归 关于 与 误差 项 之 创 的 相关 问题 提供 了 一 个 通 解 。 在 一 个 具有 局 部 依从 性 的 实验 中 ,分 
配 的 处 理 水 平 可 作为 实际 处 理 水 平 的 一 个 工具 变量 。 

回想 一 下 ,一 个 变量 要 成 为 一 个 有 效 的 工具 变量 ,必须 满足 工具 变量 相关 性 和 外 生性 这 
两 个 条 件 ( 见 重要 概念 10. 3) 。 只 要 协议 被 部 分 地 遵守 ,那么 实际 的 处 理 水 平 ( 工 ) 就 部 分 地 
由 分 配 的 处 理 水 平 (2,) 所 决定 ,因此 工具 变量 Z, 是 相关 的 。 如 果 分 配 的 处 理 水 平 是 随机 次 
定 的 一 也 就 是 说 ,如 果实 验 是 随机 分 配 的 一 而 且 分 配 除了 通过 对 处 理 是 否 被 接受 产生 
影响 外 ,如 果 该 分 配 本 身 对 结果 没有 影响 ,那么 Z, 是 外 生 的 。 也 就 是 说 ,Z, 的 随机 分 配 意 奈 
着 E(u |Z.) =0, 其 中 心 是 公式 (11.1) 差分 设 定 中 的 误差 项 还 是 公式 (11.4) 差分 再 差分 


设 定 中 的 误差 项 ,依赖 于 使 用 哪个 估计 量 。 这 样 ,在 一 个 存在 局 部 依从 性 和 随机 分 配 处 理 的 
实验 中 ,最 初 的 随机 分 配 是 个 有 效 的 工具 变量 。 


11.3.5 随机 化 的 检验 


随机 化 可 以 通过 检查 该 随机 化 变量 实际 上 是 否 依 赖 于 任何 可 观测 的 个 体 特征 来 检验 。 

检验 处 理 的 随机 接受 “如 果 处 理 是 被 随机 地 接受 的 ,那么 工 将 与 这 个 可 观测 的 个 体 特 
征 不 相关 。 因 此 ,处 理 是 被 随机 地 接受 的 "这 一 假设 ,可 通过 检验 "在 一 个 下 AFi... 
W. 的 回 妇 中 ,到 ,，… 丈 ;的 系数 都 是 0" 这 -~ 假 设 进行 检验 。 在 工作 培训 项 目 那个 例子 中 ， 
用 接受 工作 培训 (多) 对 性 别 、 种 族 和 前 置 教育 水 平 (更 ) 进 行 回归 ,并 计算 检验 W 系数 是 香 
都 是 0 的 到 统计 量 , 可 对 以 下 假设 提供 检验 , 即 * 处 理 是 被 随机 地 接受 的 " 零 候 设 和 ”接受 处 
理 依赖 于 性 别 ,种族 或 前 置 教育 水 平 " 的 备 择 假设 .0 

检验 随机 分 配 。 如 果 处 理 被 随机 地 分 配 ,那么 该 分 配 Z, 将 与 可 观测 的 个 体 特征 不 相 
美 。 因 此 ,处 理 被 随机 地 分 配 "这 个 假设 可 通过 将 2, 对 琵 ,,…, 现 .进行 回归 以 及 检验 所 有 
的 斜率 系数 都 是 0 的 零 假设 进行 检验 。 


Ll1.4 减 小 班级 规模 效应 的 实验 估计 值 ] 


在 这 一 节 , 我 们 回 到 第 2 部 分 中 所 处 理 的 问题 ; 减 小 低 年 级 班级 的 规模 对 考试 成 绩 的 效 
应 是 什么 ? 在 20 世纪 80 年 代 后 期 ,田纳西 州 执行 了 一 个 很 大 的 ,花费 几 百 万 美元 的 随机 化 
控制 实验 ,以 确定 减 小 班级 规模 是 否 是 一 种 改善 初等 教育 的 有 效 方法 。 这 个 实验 的 结论 已 
强烈 地 影响 到 我 们 对 减 小 班级 规模 效应 的 理解 。 


11.4.1 实验 设计 


旺 编 西 州 减 小 班级 规模 的 实验 , 即 所 知 的 STAR J| Ej ( Student-Teacher Achievement 
Ratio) , 它 是 用 来 评估 小 班 对 学 习 影 响 的 一 个 四 年 期 的 实验 。 由 田纳西 州立 法 委员 会 提供 
基金 ,在 这 四 年 间 这 个 实验 大 约 花 费 了 1 200 万 美元 。 该 项 研究 比较 了 从 幼儿 园 直 到 三 年 
级 三 种 不 同 的 班级 安排 :常规 班 ,每 班 22 ~ 25 个 学 生 ,一 位 教师 ,没有 助教 ;小 型 班 ,每 班 13 
- 17 个 学 生 , 没 有 助教 ;还 有 -种 班 型 , 即 一 个 常规 班 ,再 加 上 一 位 老师 的 助教 。 

参与 该 实验 的 学 校 每 种 类 型 的 班级 至 少 有 一 个 ,在 1985 一 1986 学 年 初 ,进入 到 该 学 校 
幼儿 园 的 学 生 , 被 随机 地 分 配 到 这 三 种 类 型 的 班级 中 ,教师 也 被 随机 地 分 配 到 这 三 种 类 型 的 
班级 中 。 

很 据 最 初 的 实验 协议 ,学 生 在 他 们 最 初 所 分 配 的 班级 中 需要 果 四 年 ,也 即 实验 期 的 四 年 
(从 幼儿 园 直 到 三 年 级 ) ,然而 ,由 于 学 生 家 长 的 抱 忽 , 在 一 年 级 刚 开始 ,最 初 被 分 配 到 常规 
班 ( 有 助教 或 没有 助教 ) 的 学 生 被 随机 地 重新 分 配 到 有 助教 的 常规 班 或 没有 助教 的 常规 班 
中 ;最 初 被 分 配 到 小 班 的 学 生 仍 留 在 小 班 里 。 进 人 学 校 的 一 年 级 新 生 ( 幼儿 园 是 可 以 任意 
选择 的 ) ,在 实验 的 第 二 年 被 随机 地 分 配 到 这 三 种 类 型 的 班级 中 。 每 年 ,实验 中 的 学 生 都 要 
进行 阅读 和 数学 的 标准 化 考试 (斯 坦 福 达标 考试 ) 。 

为 了 达到 目标 的 班级 规模 ,这 个 项 目 对 额外 教师 和 助教 给 予 了 补偿 。 在 该 项 研究 的 第 








D 在 这 个 例子 中 ,X, 是 二 元 变量 ,因此 如 第 9 章 中 所 讨论 的 ,站 对 形 , ,的 回归 是 一 个 线性 概率 模 盘 , 异 方差 
稳健 的 标准 误 是 非常 必要 的 。 当 革 是 二 元 变 基 时 ,检验 假设 5( 世 1W W. KM W... WW, 的 另 一 种 方法 是 司 
F probit 模型 或 logu 模型 ( 见 9.2 节 )。 











一 年 期 间 ,大 约 有 6 400 名 学 生 参 加 了 108 个 小 班 .101 个 常规 班 和 99 个 有 助教 的 常规 班 。 
在 整个 研究 的 4 年 间 , 有 80 所 学 校 共 约 11 600 名 学 生 参 加 了 这 项 研究 。 

实验 设计 的 侧 山 ”该 实验 协议 规定 ,除了 在 一 开始 的 一 年 级 通过 随机 化 分 配 以 外 ,学 
生 不 应 该 换班 ,然而 , 约 有 10 久 的 学 生 在 随后 的 年 份 里 因 性 格 不 合 和 行为 举止 等 问题 而 换 
班 。 这 些 换班 行为 代表 了 与 随机 化 计划 的 偏离 ,这 依赖 于 换班 的 真实 性 质 。 这 些 换班 行为 
存在 将 偏差 引信 结论 的 潜在 可 能 性 。 对 于 那些 纯粹 为 了 避免 个 性 冲突 而 进行 的 换班 ,可 能 
与 实验 结果 完全 无 关 , 所 以 他 们 涉 会 引信 仿 差 。 然 而 ,如 果 因 为 家 长 关心 他 们 孩子 的 教育 ， 
问 学 校 施加 压力 将 孩子 转 到 小 班 而 出 现 换班 ,那么 没有 遵守 该 实验 协议 会 使 结论 偏向 于 村 
大 小 班 的 效果 。 与 实验 协议 的 另 一 种 偏离 是 , 由 于 学 生 换 班 和 迁 和 人 迁 出 该 学 区 ,班级 规模 随 
时 间 发 生 了 变化 。 
11.4.2 STAR 数据 分 析 

由 于 存在 两 个 处 理 组 一 一 小 班 和 有 助教 的 常规 班 ,因此 差分 佑 计量 的 回归 形式 需要 修 
改 ,以 处 理 两 个 处 理 组 和 控制 组 。 这 可 通过 引 人 两 个 二 元 变量 来 实现 ,一 个 变 基 表示 学 生 是 
和 否 在 小 班 中 , 另 一 个 变量 表示 学 生 是 否 在 有 惑 教 的 常规 班 中 ,于 是 生成 了 如 下 的 总 体 回归 
模型 : 





Y, =B, +B i SmallClass, + B, RegAide, + u, (11.6) 
其 中 ,如 果 第 ;个 学 生 在 小 班 中 ,那么 SmaliClass, =1; 否 则 ,SmaliClass, =0。 如 果 第 i 个 学 生 
在 有 助教 的 常规 班 由 ,那么 RegAide, =1; 否 则 ,RegAide, =0, Y, 是 考试 成 绩 。 相 对 于 常规 班 
来 说 ,小 班 对 考试 成 绩 的 效应 是 A ;相对 子 小 班 来 说 ,有 助教 的 常规 班 的 效应 是 8,。 该 实验 
的 差分 忻 计 量 可 通过 用 OLS 估计 方程 (11.6) 中 的 B 和 应 进行 计算 。 

Rl 给 出 了 在 小 班 或 有 助教 的 常规 班 中 对 考试 成 绩效 应 的 差分 估计 值 。 表 11 一 1 
回归 中 的 因 变 量 Y. 是 学 生 合并 的 斯 坦 福 达 标 考 试 的 数学 和 阅读 部 分 的 总 成 绩 。 根 据 表 
11 一 1 中 的 估计 信 , 对 幼儿 园 学 生 而 言 ,相对 于 在 常规 班 中 , 在 小 班 中 对 考试 成 绩 的 效应 是 
增加 13.9 分 ;在 有 助教 的 常规 班 中 对 考试 成 绩 的 估计 效应 是 增加 0.31 分 。 对 每 个 年 级 而 
言 ,小 班 没 有 提高 成 绩 的 堂 假设 在 1% (双边 ) 的 显著 性 水 平 下 被 拒绝 。 不 过 ,相对 于 没有 助 
教 的 常规 班 ,拒绝 有 助教 的 常规 班 没 有 提高 成 绩 的 零 假设 是 不 可 能 的 ,除了 在 一 年 级 。 唱 然 
一 年 级 的 估计 值 比较 大 ,但 是 在 幼儿 园 .二 年 级 和 三 年 级 中 ,小 班 所 估计 的 提高 的 幅度 普遍 
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注 : 上 述 回 归 是 使 用 附录 11 1 中 所 拱 述 的 STAR 项 目 公共 数据 集 估计 的 。 因 变量 是 在 斯 坦 福 达 标 考 
试 中 数学 和 阅读 部 分 学 生 的 合并 成 绩 。 标 准 误 在 系数 下 面 的 括号 中 给 出 。” 代表 使 用 双边 检验 时 单个 系 
数 在 1 名 的 显著 性 水 平 下 在 统计 上 是 显著 的 。 








的 2.16。 

由 于 教师 被 随机 地 分 到 校内 所 有 类 型 的 班级 中 去 ,因此 实验 也 提供 了 估计 教师 的 经 验 
对 考试 成 绩 的 效应 的 机会 。 然 而 ,教师 在 工作 的 学 校 之 间 并 不 是 被 随机 地 分 配 的 ,一 些 学 校 
比 另 一 些 学 校 有 更 多 的 经 验 丰富 的 教师 。 因 而 ,教师 经 验 可 能 与 误差 项 相关 ,如 果 有 丰富 经 
验 的 教师 在 共有 更 网 资 源 和 更 高 平均 考试 成 绩 的 学 校 工作 ,那么 情况 就 会 如 此 。 因 此 ,要 估 
计 教 师 经 验 对 考试 成 绩 的 效应 ,我 们 必须 控制 学 校 的 其 他 特征 ,这 可 通过 对 每 个 学 校 使 用 一 
组 完备 的 指示 变量 (“学 校 效 应 ” ) 来 实现 ,也 即 代 表 学 生 所 上 学 校 的 指示 变量 。 由 于 教师 在 
校内 是 被 随机 地 分 配 的 ,因此 对 于 给 定 的 学 校 ,w 的 和 象 件 均值 并 不 依赖 于 该 处 理 。 用 附录 
11.3 中 的 术语 表述 ,由 于 校内 的 随机 分 配 ,条 件 均值 独立 性 假设 成 立 ,其 中 额外 回归 因子 W 
是 学 校 的 效应 。 当 学 校 效 应 被 包含 进来 时 ,教师 经 验 效 应 的 估计 值 减 小 了 一 半 , 从 第 (2) 列 
的 1.74 减 小 到 第 (3) 列 的 0. 74。 即 使 这 样 ,第 (3) 列 的 估计 值 在 统计 上 仍 是 显著 的 ,而 且 数 
值 又 适度 地 大 。 纪 年 的 经 验 对 应 于 考试 成 绩 预 测 值 增加 7.4 分 。 

现在 我 们 来 尝试 解释 表 11 一 2 中 的 一 些 其 他 系数 。 例 如 ,在 这 些 标准 化 考试 中 ,幼儿 园 
里 的 男孩 比 女 孩 成 绩 差 ,但 是 ,这 些 个 体 学 生 的 特性 并 不 是 被 随机 分 配 的 (参加 考试 的 学 生 
性 别 并 不 是 被 随机 分 配 的 !) ,所 以 这 些 额外 回归 因子 可 能 与 遗漏 变量 相关 。 例 如 ,如 果 种 
族 因素 或 免费 享受 午餐 资格 与 减少 的 校外 学 习 的 机 会 相关 ( 表 11 一 2 的 回归 中 遗漏 了 这 
个 ) ,那么 它们 的 估计 系数 会 反 身 这 些 遗 漏 的 影响 。 如 11 一 2 节 中 所 讨论 的 ,如 果 处 理 被 随 
机 地 分 配 ,那么 其 系数 的 估计 量 都 是 一 致 的 ,不 论 其 他 回归 因 于 是 否 与 误差 项 相关 。 但 是 ， 
如 果 额 外 回归 因子 与 误差 项 相关 ,那么 它们 的 系数 估计 量具 有 遗漏 变 量 偏 差 。 

解释 班级 规模 的 估计 效应 。 从 实际 意义 上 说 , 表 11 一 1 和 表 11 一 2 所 给 出 的 班级 规模 
的 估计 效应 是 大 还 是 小 呢 ? 回答 这 个 问题 有 两 种 方法 :第 一 ,将 原始 考试 成 绩 的 估计 变化 转 
化 为 考试 成 绩 的 标准 差 单位 ,这 样 , 表 11 一 1 中 的 估计 值 在 年 级 之 间 都 是 可 比 的 ;第 二 ,将 所 
估计 的 班级 规模 的 效应 和 表 11 一 2 中 的 其 他 系数 进行 比较 。 

由 于 每 个 年 级 考试 成 绩 的 分 布 都 不 是 一 样 的 ,因此 表 11 一 1 中 所 估计 的 效应 在 年 级 问 
并 不 是 直接 可 比 的 。 我 们 在 7. 3 节 中 就 面 对 过 这 个 问题 ,当时 ,我 们 想 要 比较 使 用 取 自 加 利 
福 尼 亚 州 的 数据 所 估计 的 减 小 学 生 一 教师 比 对 考试 成 绩 的 效应 和 以 马萨诸塞 州 的 数据 为 基 
础 的 估计 值 。 由 于 这 两 个 检验 是 不 同 的 ,因此 系数 不 能 直接 作 比 较 。7. 3 节 中 的 解决 方法 
是 ,将 所 估计 的 效应 转化 为 考试 成 绩 的 标准 差 单位 ,因此 学 生 一 教师 比 的 单位 碱 少 ,对 应 于 
所 估计 的 考试 成 绩 标准 差 的 变化 。 在 此 ,我 们 采用 这 种 方法 ,目的 是 使 表 11 一 1 中 的 估计 效 
应 在 年 级 之 间 是 可 比较 的 。 例 如 ,幼儿 园 里 孩子 的 考试 成 绩 标准 差 是 73.7 分 ,因此 ,依据 表 
11 一 1 中 的 估计 值 ,在 幼儿 园 小 班 中 的 效应 是 13.9/73.7 =0 19 ,标准 误 是 之 45773.7 = 
0.03。 将 表 11—1 中 班级 规模 的 估计 效应 ,转化 成 学 生 之 间 考 试 成 绩 的 标准 差 单位 ,其 结果 
在 表 11 一 3 中 做 了 总 结 。 如 用 标准 差 单位 来 表达 ,在 小 班 中 的 估计 效应 对 幼儿 园 .二 年 级 以 
及 三 年 级 而 言 是 相似 的 ,大 约 为 考试 成 绩 一 个 标准 差 的 1/5。 同 样 ,对 幼儿 园 .二 年 级 和 三 
年 级 面 言 , 在 一 个 带 有 助教 的 常规 班 中 的 估计 效应 约 为 0。 对 一 年 级 来 说 ,估计 的 处 理 效应 
比较 大 。 然 而 ,对 一 年 级 而 言 , 小 班 和 带 有 一 个 助教 的 常规 班 之 间 的 估计 差异 是 0.20 分 ,与 
其 他 年 级 一 样 。 因 而 ,对 一 年 级 的 结果 的 一 个 解释 是 ,控制 组 中 的 学 生 一 一 不 带 有 助教 的 党 
规 班 一 -在 那 一 年 由 于 一 些 不 同 寻常 的 原因 ,也 许 仅 仅 是 由 于 简单 随机 抽样 的 变 差 ,而 碰巧 
在 考试 上 表现 得 较 差 。 

另 一 种 测量 小 班 估计 效应 大 小 的 方法 是 ,比较 所 估计 的 处 理 效应 和 表 11 一 2 中 的 其 他 
系数 。 在 幼儿 园 里 ,被 分 配 在 小 班 中 对 考试 成 绩 的 估计 效应 是 13.9 分 { 表 11 一 2 的 第 (1) 





行 ) 。 保 持 种 族 ,教师 的 工作 年 限 . 免 费 亭 受 午 餐 的 资格 以 及 处 理 组 不 变 , 根 据 表 11 一 2 的 
第 (4) 列 中 的 佑 计 值 ,在 标准 化 考试 中 ,男生 成 绩 比 女生 成 绩 约 低 12 分 。 因 此 ,被 分 配 在 小 
班 中 的 估计 效应 要 比 女 生 和 男生 之 间 的 成 绩 差 距 稍 大 一 些 。 作 为 另 一 种 比较 ,第 (4) 列 中 
教师 工作 年 限 的 和 估计 系数 是 0.66, 所 以 ,一 位 具有 20 年 教龄 的 教师 佑 计 会 使 考试 成 绩 提 高 
13 分 。 因 而 ,相对 于 新 教师 而 言 ,在 小 班 中 的 估计 效应 与 具有 20 年 教龄 的 富有 经 验 的 教师 
的 效应 大 概 是 一 样 的 。 这 些 比较 表明 了 在 小 班 中 的 估计 效应 是 荡 大 的 。 




















#3 ERRELE EIET TA 
年 级 
处 理 组 = 
K l 2 3 
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注 :前 两 行 中 的 估计 值 和 标准 误 是 表 11 一 1 中 的 佑 计 效 应 , 除 以 该 年 级 的 斯 坦 福 考试 成 绩 的 样本 标准 
差 ( 表 11 一 ] 中 的 最 后 一 生 ) ,使 用 实验 中 的 学 生 数 据 所 计算 得 到 的 。 标 准 误 在 系数 下 面 的 括号 中 给 出 。 
“代表 使 用 双边 检验 时 个 别 系数 在 1 名 的 显著 性 水 平 下 在 统计 上 是 显著 的 。 

其 他 一 些 结论。 经 济 计 量 学 家 统计 学 家 以 及 初等 教育 专家 已 研究 了 这 个 实验 的 不 同 
方面 ,在 此 我 们 简要 地 总 结 其 中 的 部 分 研究 发 现 。 发 现 之 一 是 ,小 班 的 效应 集中 在 最 低 的 年 
级 ,这 从 表 11 一 3 中 可 以 看 出 ,除了 一 年 级 有 异常 结论 之 外 , 表 11 一 3 中 给 出 的 常规 班 和 小 
班 之 间 考 试 成 绩 的 差距 基本 上 在 年 级 之 间 是 个 常数 (幼儿 园 是 0. 19 个 标准 差 单位 ,二 年 级 
是 0.23 ,三 年 级 是 0. 21) 。 由 于 最 初 被 分 到 小 班 的 孩子 仍 留 在 那个 小 班 中 , 因此 , 这 意味 着 
留 在 小 班 中 不 会 产生 额外 好 处 ,但 是 ,最 初 的 分 配 所 获得 的 好 处 由 高 年 级 所 获得 ,不 过 在 处 
理 组 和 控制 组 之 间 的 差距 没有 增加 。 另 一 个 研究 发 现 是 ,如 表 11 一 3 的 第 {2) 行 所 示 , 这 个 
实验 表明 在 常规 班 中 配备 助教 几乎 没有 什么 好 妈 。 关 于 解释 该 实验 结果 的 一 个 潜在 理由 
是 ,一 些 学 生 没有 遵守 该 处 理 协议 (一 些 学 生 从 小 班 中 转 出 ) 。 如 果 在 幼儿 车 中 的 最 初 安置 
基 随 机 的 ,而 且 对 考试 成 绩 没 有 直接 影响 ,那么 最 初 安置 可 被 作为 一 个 部 分 地 而 不 是 完全 地 
影响 安置 的 工具 变量 。 这 个 方法 最 里 是 由 Kmeger( 1999) 提 出 来 的 ,利用 最 初 的 班级 安置 作 
为 工具 变量 ,他 使 用 两 阶段 最 小 二 乘 (TSLS) 估计 了 班级 规模 对 考试 成 绩 的 效应 。 他 发 现 
TSLS 和 OLS 估计 值 是 相似 的 ,这 导致 他 得 出 这 样 的 结论 :与 实验 协议 的 偏离 并 没有 对 OLS 
估计 值 产生 广大 的 偏差 。0 


11.4.3 班级 规模 效应 的 观测 估计 值 和 实验 估计 值 比较 


基于 加 利 福 尼 亚 州 和 马萨诸塞 州 学 区 的 观测 数据 ,第 2 部 分 给 出 了 班级 规模 效应 的 多 
元 回归 估计 值 。 在 那些 数据 中 ,班级 规模 并 不 是 被 随机 分 配 的 ,而 是 由 地 方 学 校 的 官员 在 平 
衡 理 想 的 教育 目标 和 现实 的 预算 约束 条 件 下 决定 的 。 怎 样 把 这 些 观测 估计 值 与 STAR 项 目 
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的 实验 估计 值 相 比较 呢 ? 

为 了 将 加 利 福 尼 亚 州 和 与 萨 诸 塞 州 的 估计 秆 同 表 11—3 中 的 和 估计 和 值 比较 ,这 样 做 是 非 
常 必 要 的 , 即 以 相同 的 班级 减 小 规模 并 用 考试 成 绩 的 标准 差 单 位 来 表示 预测 将 应。 在 
STAR 项 目 实验 的 4 年间, 小 班 比 大 班 平均 约 少 7.5 个 学 生 , 因 此 我 们 使 用 观测 知 计 值 来 预 
测 每 班 减少 7. 5 个 学 生 对 考试 成 绩 的 效应 。 根 据 表 7 一 3 第 (1) 列 中 所 总 结 的 线性 设 定 的 
OLS 秸 计 值 ,加利福尼亚 州 的 估计 值 使 我 们 预测 出 ,学 生 一 教师 比 减少 7.5 个 单位 会 使 考试 
成 绩 增 加 5.5 分 (0. 93 x7.5) 。 加 利 福 尼 亚 州 学 生 间 的 考试 成 绩 标准 差 大 约 是 38 分 ,因此 . 
用 学 生 间 考试 成 绩 的 标准 差 单位 来 表示 ,减少 7.5 个 学 生 的 估计 效应 是 5.5/38 = 0. 14 个 标 
HD 加利福尼亚 州 所 估计 的 斜率 系数 的 标准 误 是 0. 26( 见 表 7 一 3) ,因此 以 标准 差 单 位 
表示 的 减少 7. 5 个 学 生 的 估计 效应 的 标准 误 是 0. 26 x7. 5/38 一 0.05。 这 样 ,基于 加 利 福 尼 
亚 州 的 数据 ,用 学 生 间 考试 成 绩 标准 差 单 位 表示 ,每 班 减少 7.5 个 学 生 的 估计 效应 是 0. 14 
个 标准 差 , 标 准 误 是 0.05。 这 些 计算 以 及 马萨诸塞 州 的 类 似 计算 ,连同 取 自 表 11 一 2 第 (1) 
列 中 对 幼儿 园 的 STAR 估计 值 一 起 ,在 表 11 一 4 中 总 结 。 














表 11 一 4 基于 STAR 数据 和 加 利 弗 尼 亚 州 与 马萨诸塞 州 的 观测 
数据 计算 的 ,学 生 一 教师 比 减 少 7. 5 的 估计 效应 
RAR) 5) 小 班 与 常规 班 73.8 o WA (0.13,0 25) 
MAREEA o HN -7.5 38.0 M a (0.04,0. 24) 
马萨诸塞 州 ob -7.5 39.0 o sa 《0.02.0.22》 


注 :STAR 研究 的 估计 系数 各 取 自 表 11 一 2 的 第 ( 1) 列 。 加 利 福 尼 亚 州 和 马萨诸塞 州 研究 的 估计 系数 
Â 到 自 表 ? 一 3 的 第 (1) 列 。 所 估计 的 效应 是 指 相对 于 常规 班 来 说 在 小 班 中 的 效应 { 对 于 STAR) ,或 者 说 
是 学 生 一 教师 比 减少 7.5 个 单位 的 效应 {对 加 利 福 尼 亚 州 和 马萨诸塞 州 来 说 移 )。 减 少 学 生 一 教师 比 的 
95 免 的 置信 区 间 是 这 个 估计 效应 圭 1.% 倍 标准 误 。 标 准 误 在 估计 效应 下 面 的 插 号 中 给 出 。 当 使 用 双边 检 
验 时 ,所 估计 的 获 雇 在 "5 符 的 显著 性 水 平 下 或 在 "1 名 的 显著 性 水 平 下 在 统计 上 是 显著 地 异 于 0 的 。 

从 加 利 福 尼 亚 州 和 马萨诸塞 州 的 观测 研究 中 得 出 的 估计 效应 比 STAR 的 估计 效应 稍微 
小 一 些 。 热 而 ,解释 不 同 研 究 的 估计 值 不 相同 的 一 个 原因 是 随机 抽样 的 变化 性 ,因此 ,比较 
三 个 研究 所 得 出 的 佑 计 效 应 的 置信 区 间 是 有 意义 和 的。 基于 幼儿 园 的 STAR 数据 ,在 小 班 中 
效应 的 95 铝 的 置信 区 间 ( 在 表 11 一 4 的 最 后 一 列 中 给 出 ) 是 0. 13 到 0,25。 基 于 加 利 福 尼 亚 
州 的 观测 数据 ,类 似 的 5 名 的 置信 区 间 是 0.04 到 0. 24, 而 对 马萨诸塞 州 来 说 ,相应 的 95% 
的 置信 区 间 是 0. 02 到 0.22。 因 而 ,从 加 利 福 尼 亚 州 和 马萨诸塞 州 的 研究 中 得 出 的 95% 的 
置信 区 间 包 含 了 从 STAR 幼儿 园 数 据 中 得 出 和 掏 5 名 的 置信 区 间 的 大 部 分 。 从 这 个 方面 来 
看 ,这 三 个 研究 都 给 出 了 普遍 相似 的 估计 值 范围 。 

有 许多 理由 可 以 解释 为 什么 实验 估计 秆 与 观测 知 计 和 值 不 同 。 一 个 理由 是 ,如 7.3 节 中 


_ 


E UAE IRA R 差 给 出 的 ,在 表 11 一 3 中 , 傅 
标准 差 大 于 地 区 间 的 标准 差 ,对 MHP E WAN , EM E 2 38, bn MAE 


所 讨论 的 ,仍然 存在 对 该 观测 性 研究 内 部 有 效 性 的 残余 威胁 。 例 如 ,由 于 经 常 有 护 子 迁 出 迁 
进 该 地 区 ,该 地 区 的 学 生 一 教师 比 可 能 并 不 反 跌 学生 实际 所 经 历 的 学 生 一 教师 比 , 因 此 ,由 
于 存在 变量 误差 偏差 ,加 利 福 尼 亚 州 和 马萨诸塞 州 研究 中 的 学 生 一 教师 比 的 系数 可 能 会 偏 
向 于 0。 其 他 的 理由 主要 关注 外 部 有 效 性 。 在 观测 研究 中 所 使 用 的 地 区 平均 的 学 生 一 教师 
比 与 班级 中 的 实际 孩子 数 (STAR 项 目 中 的 实验 变量 ) 不 是 同一 同事 。STAR 项 目 发 生 在 20 
世纪 80 年 代 的 南部 州 ,可 能 不 同 于 1998 年 的 加 利 福 尼 亚 州 和 马萨诸塞 州 , 且 所 比较 的 年 级 
不 同 ( 在 STAR 中 是 及 ~3 年 级 ,在 马萨诸塞 州 是 4 年 级 ,在 加 利 福 尼 亚 州 是 5 年 级 )。 就 所 
有 这 三 个 预测 不 同 估计 值 的 理由 来 说 ,这 三 个 研究 的 结论 是 非常 相似 的 。 观 测 性 研究 类 似 
F STAR 项 目的 估计 值 这 一 事实 表明 ,观测 估计 值 内 部 有 效 性 的 残余 威胁 是 很 小 的 。 


-11.5 准 实验 - 


真正 的 随机 化 控制 实验 是 很 昂贵 的 一 一 STAR 实验 花费 了 1 200 万 美元 一 而且 它们 
常会 引发 道德 问题 。 在 医学 中 ,通过 随机 地 将 主体 分 配 到 吸烟 的 处 理 组 中 和 不 吸烟 的 控制 
组 中 ,以 确定 吸烟 对 寿命 的 影响 ,这 是 不 道德 的 。 在 经 济 学 中 ,通过 向 随机 选择 的 高 中 生出 
售 带 有 补贴 的 香烟 来 估计 青少年 对 香烟 的 需求 弹性 也 是 不 道德 的 。 出 于 成 本 .道德 和 现实 
的 原因 ,经 济 学 中 真正 的 随机 化 控制 实验 很 少 。 

不 过 ,随机 化 控制 实验 的 统计 观点 和 方法 可 以 被 推广 到 非 实 验 的 环境 中 来 。 在 一 个 准 
实验 {quasi-experiment) ,也 即 自然 实验 (natural experiment) 中 ,随机 性 是 被 在 个 体 的 环境 
中 发 生 的 变 差 引入 的 ,因此 处 理 仿 佛 是 被 随机 地 分 配 的 。 这 些 在 个 体 环 境 中 发 生 的 变 差 可 
能 由 多 种 原因 所 引发 ,例如 ,法 律 机 构 反 复 无 常 的 行为 ,场所 的 变化 ,政策 或 项 目 执行 的 时 效 
性 ,自然 随机 性 ;例如 ,出 生日 期 ,降雨 量 ,或 与 当前 所 研究 的 因果 效应 无 关 的 其 他 因素 等 。 

存在 两 种 类 型 的 准 实验 。 在 第 一 种 类 型 的 准 实验 中 ,不 论 一 个 个 体 (或 重 一 般 地 说 ,一 
个 实体 ) 是 理 接受 处 理 ,都 被 认为 仿 贰 是 被 随机 地 决定 的 。 在 此 情形 下 ,利用 该 处 理 碟 作为 
回归 因子 ,可 以 用 OLS 估计 所 研究 的 因果 效应 。 

在 第 二 种 类 型 的 准 实验 中 ,所 亩 ”仿佛 "随机 变化 只 是 处 理 的 部 分 决定 性 因素 。11. 3 W 
讨论 了 在 一 项 实验 中 , 当 随 机 分 配 影响 到 实际 接受 的 处 理 时 ,该 随机 分 配 可 被 作为 一 个 工具 
变量 来 使 用 。 同 理 ,在 一 项 准 实验 中 “仿佛 ”随机 变化 有 时 握 供 了 一 个 可 影响 实际 接受 的 
处 理 ( 互 ) 的 工具 变量 (Z.) 。 因 此 ,用 工具 变量 回归 估计 因果 效应 ,这 里 变 差 的 “仿佛 ”随机 
性 来 源 提供 了 该 工具 变量 。 


11.5.1 几 个 例子 


我 们 用 例子 来 说 明 这 两 种 类 型 的 准 实验 。 第 一 个 例 子 是 一 个 准 实验 的 例子 ,其 中 的 处 
理 是 “仿佛 "被 随机 地 决定 的 。 在 第 二 个 和 第 三 个 准 实验 的 例子 中 , “仿佛 ”的 随机 变 差 影响 
了 (但 并 不 完全 决定 ) 处 理 的 水 平 。 

例 1: 劳 动用 市 场 中 的 移民 效应 。 移 民 会 降低 工资 吗 ? 经 济 学 理论 认为 ,如 果 劳 动力 供 
给 由 于 移民 流 人 而 增加 ,那么 劳动 力 的 “价格 ” 即 工资 将 会 下 降 。 然 而 ,在 所 有 其 他 条 件 都 
相等 的 情况 下 ,移民 被 吸引 到 劳动 力 需 求 高 的 城市 ,因此 ,移民 对 工资 效应 的 OLS 估计 量 将 
会 是 有 偏 的。 一 个 理想 的 估计 移民 对 工资 效应 的 随机 化 控制 实验 ,将 把 不 同 数量 的 移民 
(不 同 的 "处 理 " ) 随 机 地 分 配 到 不 同 的 劳动 力 市 场 (“ 主体 ”), 并 测度 对 工资 的 效应 (“ 结 
R). TE ,这样 的 实验 面临 着 严重 的 实际 ,财务 和 道德 的 问题 。 














因此 ,劳动 经 济 学 家 David Card(1990) 使 用 了 一 个 准 实验 ,在 这 个 准 实验 中 ,在 1980 年 
临时 取消 对 古巴 移民 限制 的 "玛丽亚 尔 港 船只 解 封 ( Mariel boatlitt) "期 间 , 大 量 古 巴 移 民 进 
人 佛罗里达 州 的 迈阿密 劳动 力 市 场 。 半 数 移民 定居 在 近 阿 密 , 部 分 是 由 于 迈阿密 有 个 大 的 
先前 存在 的 古巴 社 区 。 通 过 比较 迈阿密 的 不 熟练 工人 的 工资 变化 和 同期 美国 其 他 相似 城市 
中 同类 工人 的 工资 变化 ,Card 使 用 差分 再 差分 估计 量 来 估计 移民 增加 的 因果 效应 。 他 得 出 
结论 , 称 民 的 流 人 对 不 熟练 工人 工资 的 效应 是 可 以 忽略 的 。 

例 2: 服 兵役 对 平民 收入 的 效应 .在 军队 中 服 兵 役 会 改善 你 在 劳动 力 市 场 上 的 前 景 吗 ? 
军队 提供 培训 ,这 种 培训 对 未 来 的 雇主 来 说 可 能 是 有 吸引 力 的 。 然 而 ,由 于 服 兵 役 至 少 部 分 
地 是 由 个 人 选择 和 特征 决定 的 ,因此 ,通过 个 体 平民 的 收 人 对 以 前 是 否 服 过 兵役 的 OLS Fl 
归 可 能 会 得 到 一 个 服 兵役 对 平民 收 人 效应 的 有 偏 佑 计量 。 例 如 ,军队 只 接受 那些 满足 最 低 
体检 权 求 的 申请 人 ,而 在 私人 部 门 的 劳动 力 市 场 中 , 混 得 不 好 可 能 更 会 使 一 个 人 报名 参军 。 

为 了 防止 这 个 选择 偏差 的 发 生 ,Joshua Angrist (1990) 使 用 了 一 个 准 实 验 设计 ,在 这 个 淮 
实验 设计 中 ,他 研究 了 越战 期 间 在 美国 军队 中 服 过 役 的 人 的 劳动 力 市 场 的 历史 纪录 。 在 这 
个 期 间 ,一 个 年 轻 人 是 和 将 被 应 征 人 伍 ,部 分 地 是 由 人 的 生日 的 全 国 性 抽 彩 系统 决定 的 :年 轻 
人 被 随机 地 分 配 ,取得 低 的 抽 彩 号 的 人 有 资格 应 征 人 伍 , 而 取得 高 的 抽 彩 号 的 人 不 能 人 伍 ， 
但 实际 能 否 人 伍 则 是 由 复杂 的 规则 决定 的 ,包括 体检 第 选 和 茶 种 角 兔 ,而 且 一 些 年 轻 人 志愿 
参军 ,因此 ,在 军队 中 服役 只 是 部 分 地 受到 你 是 否 符合 应 征 条 件 的 影响 。 这 样 ,将 符合 应 征 
条 件 作 为 一 个 工具 变量 ,该 工具 变量 部 分 地 决定 是 否 服 兵 向 ,但 又 是 被 随机 分 配 的 。 在 这 种 
情况 下 ,存在 通过 抽 彩 来 分 配 符合 应 征 资格 这 样 --- 个 真正 的 随机 分 配 ,但 是 因为 这 种 随机 化 
没有 在 评估 服 兵 役 效应 的 实验 中 被 充分 地 采用 ,所 以 这 是 一 个 淮 实验 。Angrist 的 结论 是 ， 
服 兵 役 的 长 期 效应 是 减少 白人 老兵 的 收入, 但 不 会 减少 非 白 人 老兵 的 收入 。 

例 3; 心 肌 导 管 插入 术 的 效应 。10.5 THE T H MeClellan, McNeil 和 Newhouse ( 1994) 
所 做 的 研究 。 在 该 项 研究 中 ,他 们 使 用 从 心脏 病人 的 家 到 心肌 导管 插 人 术 医 院 的 距离 ( 相 
对 于 从 心脏 病人 的 家 到 没有 心肌 导管 插入 术 设 备 的 医院 的 距离 ) ,作为 心肌 导管 插 人 术 实 
际 处 理 的 工具 变量 。 这 项 研究 就 是 一 个 准 实 验 , 其 中 含有 一 个 部 分 地 决定 处 理 的 变量 。 处 
理 本 身 , 也 即 心 肌 导 管 插 人 术 , 是 由 病人 的 个 人 特征 以 及 病人 和 医生 的 决策 决定 的 ,然而 , 它 
也 受 附 近 的 医院 是 否 有 能 力 进行 这 个 手术 的 影响 。 如 果 这 个 病人 的 位 置 “仿佛 ”是 被 随机 
地 分 配 的 , 且 对 健康 结果 没有 直接 影响 ,而 不 是 通过 它 的 影响 来 改变 心肌 导管 播 人 术 的 概 
率 ,那么 到 一 所 心肌 导管 插 人 术 办 院 的 相对 距离 就 是 一 个 有 效 的 工具 变量 。 

其 他 的 例子 。 准 实验 研究 策略 也 已 被 应 用 到 其 他 研究 领域 。Garvey 与 Hanka 1999 ) 利 
用 美国 州 法 律 的 变 差 来 研究 反 接 管 法 对 公司 财务 结构 (例如 ,公司 债务 的 使 用 ) 的 效应 。 
Meyer, Viscusi 与 Durbin(1995) 使 用 肯塔基 放 和 密 歌 模 州 丰 九 的 失业 保险 收益 ( 它 有 差别 地 
影响 高 收 大 工人 而 不 是 低 收 人 工人 ) 药 大 的 高 散 变 化 来 佑 计 和 失业 收益 变化 对 失业 时 间 的 影 
响 。Meyer( 1995) ,Rosenzweig 与 Wolpin( 2000) 以 及 Angrist 与 Krueger( 2001 ) 的 研究 给 出 了 
经 济 学 和 社会 政策 领域 中 准 实验 应 用 的 其 他 例子 。 


11.5.2 分 析 准 实验 的 经 济 计量 方法 


分 析 准 实验 的 经 济 计量 方法 大 孝 上 与 11.3 节 中 所 列 出 的 分 析 真正 实验 的 方法 是 一 样 
的 。 如 果 处 理 水 平 X 是 “仿佛 "被 随机 决定 的 ,那么 了 系数 的 OLS 估计 量 是 软 困 效应 的 一 个 
无 偏 估 计量 。 如 果 处 理 水 平 仅 仪 部 分 地 是 随机 的 但 受到 一 个 “仿佛 "是 被 湖 机 分 配 的 变量 
Z 的 影响 ,那么 该 因果 效应 的 估计 可 通过 将 Z 作为 一 个 工具 变量 的 工具 变量 回归 来 完成 。 


由 于 准 实验 一 般 地 没有 真正 的 随机 化 ,因此 在 处 理 组 和 控制 组 之 间 可 能 会 看 在 系统 差 
异 。 如 果 是 这 样 的 话 ,那么 在 这 个 回归 中 引入 单个 主体 预先 处 理 特 征 的 十 观测 的 测量 指标 
是 非常 重要 的 ( 即 11.3 节 回 时 中 的 丈 ) 。 如 后 11. 3 节 中 所 讨论 的 ,一 般 地 ,引入 内 生 的 ( 即 
处 理 的 结果 ;回归 因子 下 会 引致 因果 效应 情 计 量 的 不 一 致 。 

在 准 实验 中 ,数据 的 收集 一 般 并 不 是 仅仅 为 了 某 一 特定 研究 的 需要 ,所 以 这 样 的 准 实验 
“主体 ”的 面板 数据 有 时 是 得 不 到 的 {一 个 例外 情况 在 方 框 中 的 关于 最 低 工资 的 例子 中 做 了 
介绍 )。 如 果 是 这 样 的 话 ,进一步 研究 的 方法 就 是 使 用 随时 间 所 搜集 的 一 系列 截面 数据 ,并 
根据 对 重复 截 闸 数 据 的 使 用 修改 11.3 节 中 的 方法 。 

使 用 重复 截面 数据 的 差分 再 差分 。 重 复 截面 数据 { repeated cross-sectional data) 集 
是 截面 数据 集 的 集合 ,其 中 每 个 截面 数据 集 对 应 着 一 个 不 同 的 时 期 。 例 如 , 某 数据 集 可 能 包 
含 400 个 不 同 个 体 在 2001 年 的 观测 值 ,500 个 不 同 个 体 在 2002 年 的 观测 值 ,总 共 900 个 不 
同 的 个 体 。 政 治 投票 数据 是 重复 截面 数据 的 一 个 例子 ,在 这 个 数据 中 ,政治 篇 好 用 一 系列 随 
机 选择 的 潜在 投票 者 的 调查 进行 测量 ,这 里 的 调查 是 在 不 同 的 时 期 进行 的 ,而 且 每 次 调查 都 
有 不 同 的 回 管 者 。 

使 用 重复 截面 数据 的 前 提 条 件 是 ,如 果 个 体 ( 更 一 般 地 讲 是 实体 ) 是 从 某 一 相同 的 总 体 
中 随机 地 抽取 的 ,那么 在 早期 截面 中 的 个 体 可 被 用 来 作为 后 期 截面 中 处 理 组 和 控制 组 中 个 
体 的 代 蔡 物 。 例 如 ,假设 与 地 方 劳动 力 市 场 没 有 关系 的 一 项 基金 增加 了 ,那么 一 个 工作 培训 
项 目 计划 在 南 加 利 福 尼 亚 州 被 扩大 了 ,而 不 是 在 北 加 利 福 尼 亚 州 。 很 设 你 有 两 个 随机 选择 
的 加 利 福 尼 亚 州 成 年 人 的 截面 数据 ,其 中 一 个 调查 是 在 培训 计划 扩张 前 实施 的 , 另 一 个 调查 
是 在 培训 计划 扩张 后 实施 的 ,那么 “处 理 组 "将 是 南 加 利 福 尼 亚 人 ,控制 组 " 将 是 北 加 利 福 
尼 亚 人 。 在 处 理 之 前 ,你 没有 实际 被 处 理 的 南 加 和 刹 福 尼 亚 人 的 数据 (因为 你 没有 面板 数 
据 ) ,但 是 你 有 与 被 处 理 的 那些 人 在 统计 上 羔 似 的 南 加 利 福 尼 亚 人 的 数据 ,这 样 ,你 可 以 使 
用 第 一 个 时 期 中 南 加 利 福 尼 亚 人 的 截面 数据 作为 处 理 组 的 预先 处 理 观 测 值 的 代替 物 ,并 使 
用 北 加 利 福 尼 下 人 的 截面 数据 作为 控制 组 预先 处 理 观 测 值 的 代替 物 。 


一 般 兴 趣 框 


最 低 工 资 对 就 业 的 影响 是 什么 

最 低 工资 的 增加 会 使 对 不 熟练 工人 的 需求 减少 多 少 ? 经 济 理论 指出 , 当 价 格 上 升 时 , 需 
求 便 下 降 , 但 确切 地 说 数量 是 多少 却 是 一 个 实证 性 闽 题 。 由 于 价格 和 数量 是 由 供给 和 需求 
决定 的 ,因此 在 就 业 对 工资 回归 的 OLS 估计 重 中 存在 联 立 因果 偏差 。 假 设 一 个 随机 化 控制 
实验 可 以 将 不 同 的 最 低 工资 随机 地 分 配给 不 同 的 雇主 , 面 后 比较 处 理 组 和 控制 组 就 业 的 变 
化 (结果 ) ,在 实际 中 这 种 假设 的 实验 如 何 操作 呢 ? 

劳动 经 济 学 家 David Card 和 Alan Krueger( 1994) 决定 进行 这 样 的 实验 ,但 是 他 们 决定 
让 “自然 "一 一 或 更 准确 地 说 是 ,地 理 一 一 为 他 们 执行 随机 化 。 在 1992 年 ,新 译 西 州 的 最 低 
工资 从 每 小 时 4 25 美元 上 升 到 5.05 美元 ,但 是 邻近 的 宾夕法尼亚 州 的 最 低 工 资 却 保持 不 
变 。 在 这 个 实验 中 ,最 低 工资 增加 的 “处 理 " 一 一 被 设置 在 新 泽 西 州 或 宾 少 法 尼 亚 州 一 一 被 
认为 “仿佛 ”是 随机 分 配 的 ,也 可 以 这 样 来 理解 ,受制 于 工资 增加 与 这 个 时 期 就 业 变化 的 其 
他 决定 性 因素 假定 不 相关 。Card 与 Krieger 搜集 了 这 两 个 州 的 快餐 店 在 工资 增加 前 后 的 就 
业 数 据 。 当 他 们 计算 差分 华盖 分 估计 量 时 ,他 们 发 现 了 一 个 令 人 惊讶 的 结果 :相对 于 宾 乡 法 
尼 亚 州 的 快餐 业 面 言 , 没 有 证 据 表明 新 泽 西 州 的 快餐 业 就 业 率 下 降 了 。 实 际 上 他 们 的 一 些 
估计 值 显示 ,相对 于 宾 少 法 尼 亚 州 来 说 ,在 快餐 业 的 最 低 工资 上升 后 ,新 泽 西 州 快餐 店 的 就 











业 率 增加 了 ! 

这 个 发 现 与 基本 微观 经 济 理论 相 冲突 ,并 产生 了 很 大 的 争议 。 后 面 的 一 些 分 析 使 用 了 
不 辣 来 源 的 就 业 数 据 , 结 果 表 明 ,在 工资 增加 之 后 ,新 泽 次 州 的 就 业 可 能 已 有 一 点 下 降 , 但 是 
即使 如 此 ,所 估计 的 劳动 力 需 求 曲线 也 是 非常 缺乏 弹性 的 ( Neumark 与 Wascher, 2000), B 
然 在 这 个 准 实验 中 ,精确 的 工资 弹性 是 个 有 争议 的 问题 ,但 是 最 低 工资 的 增加 对 就 业 的 影响 
看 起 来 比 许多 经 济 学 家 以 前 所 认为 的 要 小 。 

当 有 两 个 时 期 时 ,重复 截面 数据 的 回归 模型 是 : 

Y, =ñ, +B X, +E, +ñ, D, +B, Wi + tha, Wu +u, (11.7) 
其 中 ,, 是 截面 数据 中 第 i 个 个 体 {实体 ) 在 时 期 O =1,2) 的 实际 处 理 ,D, 是 个 二 元 指示 变 
量 , 它 在 第 一 期 等 于 0, 在 第 二 期 等 于 1。6, 也 是 一 个 二 元 变量 ,表示 某 个 个 体 是 否 在 处 理 
绝 中 (或 者 是 否 在 替代 处 理 组 中 ,如 果 观 测 值 是 磷 预 先 处 理 期 }。 如 果 他 或 她 在 第 二 期 的 外 
理 组 中 , 刘 第 i 个 个 体 接受 处 理 。 因 此 ,在 公式 (11.7) 中 ,X= xD, ERE, AX E G 和 
D, 之 间 的 交互 作用 。 

如 果 这 个 淮 实 验 使 x“ 仿佛 "是 被 随机 地 接受 ,那么 因果 效应 可 用 公式 (11.7) 中 8B 的 
OLS 估计 量 进 行 估计 。 如 果 有 两 个 以 上 的 时 期 ,那么 公式 (11.7) 应 被 修改 为 包含 了 -1 个 
表示 不 同时 期 的 二 元 变量 ( 见 附录 11.2). 

如 果 该 准 实验 使 处 理工 ,只 是 部 分 地 被 随机 接受 ,那么 通常 X. u tK, OLS 估计 量 
是 有 偏 的 昌 是 不 一 致 的 。 在 此 情形 下 ,该 准 实验 中 随机 性 的 来 源 采 取 工具 变量 Z, 的 形式 ， 
Z, 部 分 地 影响 处 理 水 平 ,而 且 “ 仿 佛 ” 是 被 随机 分 配 的 。 和 通常 一 样 ,要 使 2, 变 成 一 个 有 效 
的 工具 变量 , 它 必须 是 相关 的 (也 就 是 说 , 它 必须 与 实际 处 理 计 ,相关 ) 和 外 生 的 。 





ri1.6 _ 准 实验 中 存在 的 潜在 问题 ] 


和 所 有 的 实证 研究 一 样 , 准 实验 也 面临 着 内 部 有 效 性 和 外 部 有 效 性 的 威胁 。 对 内 部 有 
效 性 的 一 个 特别 重要 的 潜在 威胁 是 , “仿佛 ” 随机 化 实际 上 能 否 被 可 靠 地 看 做 是 真正 的 随 
机 化 。 


11.6.1 对 内 部 有 效 性 的 威胁 


在 11.2 节 中 所 列 出 的 对 真正 随机 化 控制 实验 内 部 有 效 狂 的 威胁 ,也 适用 于 准 实验 ,但 
需要 做 一 些 修改 。 

随机 化 失败 。 淮 实验 依 束 于 个 体 环境 的 差异 一 一 法 律 变化 , 突 发 狂 不 相关 事件 等 等 
一 一 来 提供 处 理 水平 中 的 "仿佛 ”随机 化 。 如 果 这 个 “仿佛 "随机 化 没有 生成 随机 的 处 理 水 
平 庆 (或 工具 变量 2) ,那么 一 般 地 说 ,0LS 估计 量 是 有 偏 的 (或 者 该 工具 变量 佑 计量 是 不 一 
致 的 )。 

和 在 真正 的 实验 中 一 样 ,检验 随机 化 失败 的 一 种 方法 是 ,检查 处 理 组 和 控制 组 之 间 的 系 
统 差异 ,例如 ,通过 用 (或 2) 对 个 体 特征 ( 殉 ) 回归 ,并 检验 四 的 系数 都 是 0 的 假设 。 如 果 
存在 不 容易 被 该 准 实 验 的 性 质 所 解释 的 差异 ,那么 这 就 是 该 准 实验 没有 产生 真正 随机 化 的 
证 据 。 即 使 在 X( 或 2) 与 之 间 不 存在 相关 关系 ,X( 或 2) 也 可 能 与 误差 项 4 中 的 一 些 观 
测 不 到 的 因素 有 关 。 由 于 这 些 因素 观测 不 到 , 因此 不 能 被 检验 “仿佛 "随机 化 这 一 假设 的 
有 效 性 必须 使 用 特定 应 用 场合 的 专门 知识 和 判断 进行 评价 。 

没有 遵守 处 理 协议 。 在 一 个 真正 的 实验 中 , 当 处 理 组 中 的 成 员 没 有 接受 处 理 和 /或 控制 





差分 估计 重 就 是 该 平均 因果 效应 的 一 个 一 致 个 计量 。 该 0LS 估计 量 是 房 = sns," (公式 
(4.8) ) 。 如 果 观 测 值 是 独立 同 分 布 的 ,那么 样本 协 方差 和 方差 就 是 总 体 协 方差 和 方差 的 一 


致 估计 量 , 即 名 一 wo w/a? 。 如 果 大 是 被 随机 分 辽 的 ,那么 就 独立 分 布 于 其 他 个 体 的 
特征 ,包括 可 观测 到 的 特征 和 不 可 疯 测 到 的 特征 ,尤其 是 独立 分 布 于 Bi,。 因 此 ,这 个 OLS fi 
计量 房 具有 极限 ， 

P Op cwi +B X +u, X) cov(B.X X > 


x —— ss . (L9) 
Sy ri Fy Fy 


这 里 ,第 三 个 等 式 使 用 了 重要 概念 2.3 中 关于 协 方差 和 colu, X) =0 的 事实 ,其 中 ,E(u1 
X,) =0( 公 式 (2.25)) 隐 含 着 cov(u,, X.) =0。 最 后 一 个 等 式 是 从 记 , 独 立 分 布 于 臣 得 出 的 。 
WEY 是 被 随机 诀 定 的 ,那么 有 ,就 确实 独立 分 布 于 工 ( 殉 练习 141.7)。 因 此 ,如 果 工 是 被 
随机 决定 的 ,那么 局 就 是 平均 因果 效应 E) 的 一 个 一 致 性 估计 量 。 


11.7.3 具有 蜡 质 因果 效应 的 IV 回归 


假设 处 理 只 是 部 分 地 被 随机 决定 的 ,2 是 个 有 效 的 工具 变量 (相关 的 和 外 生 的 )  # Z, 
XJ X, 的 效应 中 存在 异 质 性 。 具 体 来 说 ,假设 与 Z, 是 以 下 列 线性 模型 联系 的 : 
X =m tm, Z + st (11.10) 
其 中 ,系数 7,, 随 个 体 的 不 同 而 变化 。 公 式 (11. 10) 是 TSLS 的 第 一 阶段 方程 (公式 (10. 2) ) ， 
只 是 做 了 一 定 的 修改 ,这 个 修改 允许 Z. 的 变化 对 下 的 效应 在 不 同 的 个 体 之 间 是 变化 的 。 
TSLS HEE BP =s; sz  (2558010.4)) , EE Z 和 了 之 间 的 样本 协 方差 与 2 和 并 
之 阅 的 样本 碎 方 差 之 比 。 如 果 这 些 样 本 观测 值 是 独立 同 分 布 的 ,那么 这 些 样 本 协 方 差 就 是 


总 体 访 方 差 的 一 致 估计 量 ' 因此 ,有 ñ, SSE g/g oe 假设 Ty 和 Bi 独立 分 布 于 HF, 和 
2, ,而且 E(u,|Z,) = 五 (了 12.) =0,E(m,) #0, H114 中 证 明了 。 在 这 些 假 设 之 下 有 : 


apas sa P Gp ElBm,) 
= 一 一 一 一 = 一 一 一 一 11.11 
B. Szy Oa Elm) ( ) 


也 就 是 说 ,TSLS 估计 量 依 概率 收 合 于 B, 和 i, 之 积 的 期 望 值 同 ri 的 期 望 值 之 比 。 

公式 (11 11) 中 最 后 的 比值 项 可 被 解释 为 个 体 因果 效应 有 ,的 吉 权 平均 。 权 重 是 本 , 它 
测量 了 工具 变量 影响 第 :个 个 伍 是 否 接受 处 理 的 程度 。 因 此 ,TSLS 估计 量 是 个 体 因果 效应 
加 权 平 均 的 一 个 一 致 性 估计 量 ,其 中 得 到 最 大 权重 的 个 体 是 工具 变量 对 他 们 最 有 影响 的 那 
些 个 体 。 

为 了 理解 这 一 点 ,考虑 两 种 情形 :一 种 情形 是 TSLS 估计 量 是 平均 因果 效应 的 一 致 估计 
量 , 男 一 种 情形 不 是 。 首 先 , 假 设 所 有 个 体 有 相同 的 因果 效应 ,因此 对 于 所 有 的 i 有 ,= ， 
那么 ,公式 (11. 11) 中 的 最 后 一 个 表达 式 可 简化 为 E Bum) Em) BE m) EC) = 
B ,所 以 该 TSLS 估计 量 就 是 因果 效应 B, 的 一 个 一 敏 估计 量 。 也 就 是 说 ,如 果 对 于 所 有 的 个 
体 其 因果 效应 都 是 一 样 的 ,那么 这 个 因果 效应 被 TSLS 一 致 地 估计 了 ,即使 在 工具 变量 对 处 
理 概率 的 影响 中 存在 异 质 性 。 其 次 ,假设 存在 异 质 因果 效应 ,但 工具 变量 等 量 地 影响 每 个 个 
体 ,因此 有 mr =71。 在 此 情形 下 ,公式 (11. 11) 中 的 最 后 一 个 表达 式 可 简化 为 E(B,)/E 
(mu) =m ECB) m = E(B,.) ,该 TSLS 估计 量 就 是 平均 因果 效应 忆 (B,,) 的 一 个 一 致 估计 
得。 因此 ,如 果 该 工具 变量 对 所 有 个 体 的 影响 相同 ,那么 这 个 TSLS 估计 量 就 是 平均 因果 效 


p ”原文 方程 中 斜率 系数 为 m. , 疑 是 印刷 错误 一 一 译 考 广 。 














应 的 一 致知 计量, 即使 在 处 理 效 应 中 存在 总 体 异 质 性 也是 如 此 。 
再 次 ,假设 对 一 半 的 总 体 而 言 Z, 对 处 理 决 策 没 有 影响 (对 它们 而 言 ,ri =0), 而 Z 对 
男 - 一 半 总 体 有 有 一样 的 非 零 影 响 { 对 它们 而 言 ,Ti, 是 非 零 常数 ) ,那么 ,在 这 个 工具 变量 影响 处 
理 决 策 的 那 一 半 总 体 中 ,TSLS 是 平均 因果 效应 的 一 致 估计 量 。 例 如 ,假设 一 个 工作 诸 训 项 
旧 的 主体 被 给 巴 一 个 随机 的 优先 数 Z, 它 能 影响 (但 不 是 决定 ) 主 体能 否 注 册 参 加 培训 的 资 
格 。 一 些 主体 已 具有 培训 项 目 所 讲授 的 简历 写作 技能 ( 对 他 们 而 言 ,B, =0) ,他 们 认为 该 培 
训 项 目 是 在 浪费 时 间 ,不 论 他 们 的 优先 数 是 多 少 ,都 不 会 参加 这 个 培训 (因此 ,7 =0)。 不 
过 ,对 于 需要 该 项 目 所 讲授 技能 的 主体 而 言 ( 对 他 们 而 言 ,B, >0) , 优先 数 则 起 作用 。 在 这 
个 例子 中 ,TSLS 估计 了 惹 意 参加 该 项 目的 那些 主体 的 平均 因果 就 应 。 对 于 床 意 参加 该 项 目 
的 那些 主体 ,他 们 的 平均 因果 效应 比 全 部 总 体 的 平均 因果 效应 天 ,全 部 总 体 包 括 项 目 对 他 们 
有 效 的 那些 主体 和 项 目 对 他 们 无 效 的 那些 主体 。 
一 般 地 说 ,方程 (11. 11) 中 的 最 后 那个 比值 项 是 个 体 因果 效应 Bi, 的 一 个 加 权 平 均 , 用 工 
有 具 变 量 对 处 理 的 影响 力 来 加 权 。 如 果 工 具 变 量 的 效应 Ti, 独 立 于 因果 效应 BB,, 那 么 E(B 
m.) =E(B,)E(zi) BUE EBr) EC) = E(B,.,) ,进而 TSLS 是 该 因果 效应 的 一 个 一 
致 估计 量 。 然而 在 实际 中 ， 由 于 是 否 接 受 处 理 (参与 该 项 目 ) 的 个 体 决 策 依 赖 于 他 或 她 认为 
处 理 将 会 给 他 { 她 ) 们 带 来 多 少 好 处 ,因此 ,该 工具 变量 的 影响 可 能 与 因果 效应 有 关 。 因 此 ， 
在 方程 (11.11) 的 加 权 平 均 计 算 中 ,对 工具 变量 在 决定 是 否 接受 处 理 时 起 重要 影响 作用 的 
那些 个 体 的 因果 效应 ,将 给 予 较 大 的 权重 ,而 对 工具 变量 在 决定 是 否 接受 处 理 时 不 起 重要 影 
而 作 用 的 那些 个 体 的 因果 效应 ,将 给 予 较 轻 的 权重 。 
AR. 上 述 的 讨论 有 两 个 含义 。 首 先 ,在 通常 OLS 县 一致 的 情况 下 , 即 当 E(w,1X,) =0 
该 0LS 估计 量 在 总 体 存 在 异 质 因果 效应 时 仍然 是 一 致 的 ,然而 ,由 于 不 存在 单个 因果 效 
Mis OLS 佑 计量 最 好 被 解释 为 所 研究 总 体 的 平均 因果 效应 的 一 个 一 致 估计 基 。 其 
次 ,如 果 一 个 个 体 接 受 处 理 的 决策 依赖 于 该 处 理 对 那个 个 体 的 影响 力 , 那 么 通常 该 TSLS fhi 
计量 不 是 其 平均 因果 效应 的 一 致 佑 计量。 相反 ,TSLS 估计 的 是 该 因果 效应 的 一 个 加 权 平 
均 , 其 中 受 工 具 变 量 影响 最 大 的 那个 个 体 因果 效应 得 到 的 权重 最 大 。 这 样 会 导致 一 种 令 人 
不 安 的 情形 ,在 此 情形 中 ,两 个 研究 人 员 使 用 两 个 不 同 的 但 都 是 有 效 的 工具 变量 (也 即 该 工 
具 变 量 既 是 相关 的 又 是 外 生 的 ) ,会 得 到 对 “这 个 ”因果 效应 不 同 的 估计 秆 ,甚至 在 大 样 本 条 
件 下 也 是 如 此 。 昌 然 这 两 个 估计 量 通 过 它们 各 自 方程 (11. 11) 中 的 加 权 平 均 形 式 为 因果 效 
应 的 分 布 提供 了 一 些 润 察 力 , 但 是 这 两 个 估计 量 一 般 都 不 是 其 平均 因果 效应 的 一 致 估 
计量 ,了 
合子 :在 心肌 导管 狂人 人 术 研 究 中 的 应 用 。10.5 336 11.5 节 讨 论 了 McClellan, McNeil 和 
Newhouse(1991) 所 做 的 心脏 病人 心肌 时 管 插入 术 对 死亡 率 影响 的 研究 。 作 者 使 用 了 工具 
变量 回归 ,用 到 心肌 导管 插入 术 医 院 的 相对 路 高 作为 工具 变量 。 根 据 他 们 的 TSLS 估计 值 ， 
他 们 发 现 心肌 导管 插 人 术 对 健康 结果 几乎 没有 或 没有 影响 。 这 个 结果 是 令 人 人 惊讶 的 : 像 心 
肌 导 管 插 人 人 术 这 样 的 治疗 方法 在 被 批准 广泛 使 用 之 前 机 经 历 严 格 的 临床 实验 。 此 外 ,心肌 
导管 插 人 术 人 允许 外 科 医 生 执 行医 疗 干预 ,该 医疗 干预 在 10 年 以 前 就 应 该 要 求 做 大 的 医疗 手 
术 , 这 样 这 些 医 疗 干预 会 更 安全 ,并 且 长 期 来 看 可 能 对 病人 的 健康 更 有 好 处 。 这 项 经 济 计量 


D 有 不 少 RALAN 但 EPR) 关于 总 体 异 质 性 对 项 目 bak A heke 。 这 些 研究 包括 ;Heckman , Latonde 
S Smth( 1999, fi Ati 查 , 以 及 James heckman TEE SiE D] ya sn 表 的 演讲 (Hecman( 2001 ,第 了 
节 ))。 最 近 的 参考 文献 以 pt Ge fi e000 E AI 型 (该 模型 将 8, ARA ETE EE 9 


详细 讨论 和 方程 (lL [1) 中 结论 前 更 一 般 形 式 ， 


研究 怎么 没有 发 现 心肌 导管 插入 术 的 有 益 影 响 呢 ? 

一 种 可 能 的 答案 是 ,在 心肌 导管 揪 人 术 的 处 理 效应 中 存在 异 质 性 。 对 一 些 病 人 而 言 ,这 
是 个 有 效 的 干预 ,但 对 其 他 病人 ,特别 是 对 那些 更 健康 的 病人 而 言 .这 个 疗法 可 能 不 太 有 效 ， 
或 者 在 已 知 任何 外 科 手 术 所 面临 的 风险 的 条 件 下 ,这 个 疗法 可 能 是 根本 无 效 的 。 因 此 ,在 心 
及 病人 的 这 个 总 体 中 ,该 平均 因果 效应 可 能 是 (或 大 概 是 ) 正 的 。 这 样 ,该 IV 估计 量 油 量 了 
边际 效应 ,而 不 是 平均 效应 ,其 中 ,这 里 的 边际 效应 是 指 ,该 疗法 对 于 那些 到 医院 的 虑 离 是 他 
们 是 个 接 党 处 理 的 一 个 重要 因素 的 病人 的 效应 ,但 是 ,这 些 病 人 可 能 正好 是 身体 状况 相对 较 
好 的 一 些 病 人 ,对 这 些 病 人 而 言 ,从 边际 意义 上 讲 , 心 肌 导 管 搬 人 术 是 个 相对 无 效 的 疗法 。 
如 果 是 这 样 的 话 ,Meclellan , McNeil 和 Newhouse( 1991) 的 TSLS 村 计量 ,测量 了 该 疗法 对 那 
些 边际 病人 (对 他 们 而 言 , 它 是 相对 无 效 的 ) 的 效应 ,而 不 是 对 普通 病人 (对 他 们 而 言 , 它 可 
能 是 有 效 的 ) 的 效应 。 


11.8 结论 - 


在 第 1 章 中 ,我 们 根据 一 个 理想 的 随机 化 控制 实验 的 期 望 结果 ,定义 了 因果 效应 。 如 果 
一 个 理想 的 随机 化 控制 实验 是 可 获得 的 或 是 可 实行 的 ,那么 该 实验 能 够 对 所 研究 的 因果 效 
应 提供 一 个 强 有 力 的 证 据 , 尽 管 随机 化 控制 实验 受到 内 部 有 效 性 和 外 部 有 效 性 的 一 些 潜在 
的 重要 威胁 。 

虽然 随机 化 控制 实验 存在 诸多 优势 ,但 是 它 在 经 济 学 中 仍然 面临 着 一 些 困难 ,包括 道德 
间 题 和 成 本 问题 。 不 过 ,实验 方法 的 精髓 可 被 应 用 于 准 实验 。 在 准 实 验 中 ,特殊 的 环境 使 它 
看 上 去 “仿佛 "随机 化 已 经 发 生 了 。 在 淮 实 验 中 ,可 使 用 差分 再 差分 居 计 量 来 估计 因果 效 
应 ,这 个 内 果 效应 可 能 被 额外 回 关 因子 加 以 扩展 。 如 果 这 个 "仿佛 "随机 化 只 是 部 分 地 影响 
到 处 理 ,那么 就 可 以 使 用 工具 变量 回归 。 准 实验 的 一 个 重要 优势 是 ,在 数据 中 这 个 “仿佛 ” 
随机 化 的 来 源 通常 是 明显 的 ,因而 可 用 具体 的 方法 进行 评价 。 淮 实验 所 面临 的 一 个 重要 威 
胁 是 ,有 时 这 个 “仿佛 "随机 化 不 是 真正 随机 的 ,因此 ,这 里 的 处 理 ( 或 工具 变量 ) 与 遗漏 变量 
相关 ,这 样 相应 得 出 的 因果 效应 估计 量 是 有 偏 的 。 

准 实验 在 观测 数据 集 和 真正 的 随机 化 控制 实验 之 间 搭 建 了 一 座 桥 。 本 章 中 分 析 淮 实验 
所 使 用 的 经 济 计 量 方法 是 前 面 不 同 章节 中 所 阐述 的 那些 方法 :0LS 法 面板 数据 估计 法 和 工 
上 其 变量 回归 。 准 实验 与 第 2 部 分 和 第 3 部 分 中 的 研究 应 用 的 区 别 在 于 ,解释 这 些 方法 的 方 
式 和 所 应 用 的 数据 集 不 同 。 准 实验 为 经 济 计量 学 家 提供 了 一 种 思考 如 何 获得 新 数据 集 的 方 
法 ,提供 了 一 种 如 何 思考 工具 变量 的 方法 ,提供 了 一 种 评价 支撑 OLS 和 工具 变量 估计 的 那 
些 外 生性 假设 合理 性 的 方法 -了 





[总 结 ; 


L 因果 效应 是 根据 一 个 理想 的 随机 化 控制 实验 定义 的 ,因果 效应 可 以 用 处 理 组 和 控制 
组 的 平均 结果 之 差 来 估计 。 岂 于 各 种 实际 的 原因 ,以 人 为 主体 的 实验 与 理想 的 实验 经 常 有 
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偏离 ,一 个 重要 原因 是 人 们 设 有 遵守 实验 协议 。 

2、 如 果实 际 的 处 理 水 平 是 随机 的 ,那么 可 用 实验 结果 对 处 理 的 回归 来 估计 相应 的 
处 理 效应 ,也 可 以 将 额外 的 预先 处 理 的 特征 作为 回归 因子 来 改善 回归 的 效率 。 如 果 分 配 的 
处 理 Z 是 随机 的 ,但 实际 的 处 理 X, 部 分 地 是 由 个 体 选 择 决 定 的 ,那么 相应 的 因果 效应 可 使 
用 以 Z, 为 工具 变 基 的 工具 变 基 回归 进行 佑 计 。 

3, 在 一 项 准 实验 中 ,法 律 或 环境 或 自然 事故 的 变化 可 被 看 做 它们 “仿佛 ”引致 了 对 处 理 
组 和 控制 组 的 随机 分 配 。 如 果实 际 的 处 理 是 “仿佛 "随机 的 ,那么 其 因果 效应 可 用 回归 方法 
进行 估计 (也 可 能 将 额外 预先 处 理 的 特征 作为 回归 因子 ) ;如 果 分 瑟 的 处 理 是 “仿佛 "随机 
的 ,那么 相应 的 因果 效应 可 用 工具 变量 回归 进行 估计 。 

4. 对 一 项 准 实 验 研 究 内 部 有 效 性 的 一 个 重要 威胁 是 ,这 个 “仿佛 ”随机 化 是 否 实际 导致 
了 外 生性 。 由 于 存在 行为 反应 ,因此 ,就 一 个 有 效 工 具 变 量 的 要 求 条 件 来 说 ,一 个 工具 变量 
是 出 "仿佛 "随机 化 所 生成 的 ,并 不 意味 着 它 一 定 是 外 生 的 。 

s. 当 处 理 效 庶 随 个 体 变 化 时 ,如 果实 际 的 处 理 是 被 随机 分 瑟 的 或 是 被 "仿佛 ”随机 分 配 
的 ,那么 相应 的 OLS 估计 量 就 是 平均 因果 效 庶 的 一 个 一 致 佑 计量 。 不 过 ,这 个 工具 变量 佑 
计量 是 个 体 处 理 效 应 的 一 个 加 权 平 均 , 其 中 最 有 影响 的 工具 变量 所 对 应 的 个 体 得 到 最 大 的 
权重 。 








[重要 术语 ] 


项 目 评 佑 ”因果 效应 ”处理 效 应 ”差分 估计 量 ”局 部 依从 性 ”损失 ”Hawthome 效应 
带 有 额外 回归 因子 的 差分 估计 量 条件 均 值 独立 性 ”差分 再 差分 估计 量 ” 带 有 额外 回归 
因子 的 差分 再 差分 估计 量 ELE ”自然 实验 ”重复 截面 数据 平均 因果 效应 ”平均 处 理 
效应 


[复习 概念 


ILI 一 位 研究 人 员 想 研究 一 种 新 肥料 对 农作物 产量 的 效应 。 该 研究 人 员 计 划 进 行 一 
项 实验 ,在 这 个 实验 中 ,给 100 块 不 同 的 一 英亩 面积 的 土地 施 不 同 数量 的 肥料 。 这 将 有 四 个 
处 理 水 乎 :处 理 水 平 1 是 不 施肥 ;处 理 水 平 2 是 只 施 厂 家 推荐 肥料 量 的 50% ;处 理 水 平 3 是 
按 100% 推荐 量 施肥 ;处 理 水 平 4 是 按 150 多 推荐 量 施肥 。 该 研究 人 员 计划 对 前 25 块 土地 
实施 处 理 水 平 1 ,对 第 二 个 25 抉 土地 实施 处 理 水 平 2, 依 此 类 推 。 你 能 建议 一 个 更 好 的 分 本 
处 理 水 平 的 方法 吗 ? 为 什么 你 的 提议 比 该 研究 人 员 的 方法 好 ? 

11.2 对 一 种 降低 胆固醇 的 新 药 进行 临床 实验 。 使 用 对 病 大 的 随机 分 配方 法 ,给 500 
个 病人 服用 这 种 药 ,而 给 另外 的 500 个 病人 服用 安慰 剂 。 你 将 如 何 估计 这 种 药 的 处 理 效应 ? 
假设 你 有 关于 每 个 病人 的 体重 ,年龄 以 及 性 别 的 数据 ,你 能 用 这 些 数据 改善 你 的 估计 值 吗 ? 
请 给 予 解释 。 假 设 你 有 每 个 病人 在 进 人 该 实验 之 前 的 胆固醇 含量 水 平 的 数据 ,你 能 使 用 这 
些 数据 改善 你 的 估计 值 吗 ? 请 给 予 解释 。 

11.3 研究 STAR 数据 的 研究 人 员 报 道 了 一 些 佚 事 证 据 ,说 家 长 向 校长 施加 压力 以 将 
他 们 的 孩子 安置 在 小 班 。 假 设 一 些 校长 届 服 于 这 种 压力 ,将 一 些 孩 子 转 到 了 小 班 , 这 将 会 如 
何 影响 该 项 研究 的 内 部 有 效 性 ? 假设 你 手头 上 有 校长 干预 之 前 关于 每 个 学 生 的 最 初 随 机 分 
配 的 数据 ,你 如 何 使 用 这 个 信息 来 修复 这 项 研究 的 内 部 有 效 性 ? 





D 


11.4 请 解释 实验 效应 ( Ë Hawthorne 效应 ) 在 前 面 三 个 问题 的 每 个 实验 中 是 否 会 很 
重要 ? 

11.5 10.1 节 中 给 出 了 一些 学 校 受到 地 震 毁 趟 这 样 一 个 假设 的 例子 。 请 解释 为 什么 
这 是 一 个 准 实验 的 例子 ,你 如 何 使 用 这 个 事件 所 引起 的 班级 规模 的 变化 来 估计 班级 规模 对 
考试 成 绩 的 效应 。 


[练习 - 


“11.1 人 恒 用 表 11 一 1 的 结果 ,对 每 个 年 级 计算 下 列 结果 : 相 对 于 常规 班 来 说 ,小 班 处 
理 效应 的 估计 值 .标准 误 , 以 及 5 名 的 置信 多 间 { 对 于 这 个 练习 ,不 用 考虑 有 甚 教 的 常规 班 
的 结果 ) 。 

11.2 对 下 列 计算 ,使 用 表 11 一 2 第 (4) 列 中 的 结果 。 考 虚 有 这 样 两 个 班 ,它们 与 表 
11 一 2 第 (4) 列 中 的 回 妇 因 子 有 相间 的 值 ,这 两 个 班 记 为 A 和 B, 以 下 特征 不 同 : 

a. A 班 是 小 班 ,而 B 班 是 常规 班 , 构 造 平均 考试 成 绩 期 望 差异 的 中 名 的 置信 区 间 。 

b. 上班 有 一 个 5 年 教龄 的 教师 ,而 B 班 有 一 个 10 年 教龄 的 教师 ,构造 平均 考试 成 绩 期 
望 差异 的 95% B) 88 TB P< ja), 

e. À 班 是 一 个 小 班 , 其 教师 有 5 年 的 教龄 ;而 B 班 是 一 个 常规 班 ,但 其 教师 有 10 年 的 教 
苓 ,构造 平均 考试 成 绩 期 望 差 异 的 95% 的 置信 区 间 。( 提示 ;在 STAR 中 ,教师 是 被 随机 地 
分 配 到 不 同类 型 的 班级 中 的 ) 

d， 为 什么 第 (4) 列 中 没有 截 距 项 ? 

11.3 考虑 这 样 一 项 研究 ,该 研究 欲 评估 在 大 学 生 宿 舍 安 装 网 络 连接 对 大 学 生 考 试 分 
数 的 影响 。 在 一 个 大 的 宿舍 楼 中 ,有 一 半 的 罕 室 被 随机 地 安装 了 高 速 宽带 网 络 连 接 { 处 理 
组 ) ,并 搜集 了 所 有 住宿 学 生 最 后 一 门 课程 的 考试 分 数 。 下 面 哪个 因素 会 形成 对 内 部 有 效 
性 的 威胁 ?为 什么 ? 

a 在 这 个 学 年 的 中 途 , 所 有 男 运 动员 进入 了 大 学 生 联 演 会 ,并 退出 了 该 项 研究 (他 们 最 
终 的 考分 没有 被 观测 到 ) 。 

"b. 被 分 瑟 到 控制 组 的 工程 学 专业 的 学 生 ,他 们 建立 了 一 个 局 域 网 络 连接 ,这样 他 们 醋 
可 以 用 较 低 的 价格 以 集体 方式 付费 ,又 可 以 个 别 地 上 网 。 

e. 处 理 组 中 艺术 类 专业 的 学 生 从 来 没有 学 会 如 何 上 网 。 

d. 处 理 组 中 的 经 济 学 专业 ,为 那些 控制 组 中 的 学 生 支 付 上 上 网 费 。 

1.4 ”假设 一 项 随机 化 控制 实验 有 7 了 =2 期 的 面板 数据 ,其 中 第 一 期 的 观测 值 (i =1) 是 
在 实验 之 前 取得 的 ,而 第 二 期 的 观测 值 (4 =2) 是 在 处 理 后 期 取得 的 。 假 设 该 处 理 是 一 个 二 
元 变量 , 即 如 果 第 i 个 个 体 在 处 理 组 是:=2, 那 么 了 ,=1; 否 则 ,XX, =0。 进 一 步 假 设 ,可 以 使 
用 如 下 设 定 建立 处 理 效 应 模型 : 





Y. =a, +B X. +u, (11.12) 

其 中 ,a, 是 均值 为 0、 方 差 为 of 的 因 个 体 不 同 面 不 同 的 效应 (见方 程 (8. 10) ) ,而 u, ERA 

项 ,这 里 对 于 所 有 的 iw 是 同方 差 的 ,cor (wi uo) =0, 且 cov(u,,a,) =0。 BRATA 表 

示 差 分 佑 计量 ,也 即 合 有 截 距 项 的 了 ,对 ,回归 中 的 OLS 佑 计量 ;再 假设 包 *" 呈 表示 差分 
再 差分 估计 量 , 也 即 基于 AY. = Y. -了 对 AX, = X, -X ARER OLS 回归 的 BB 估计 量 。 

a 证 明 :n varpi) la? + gl)/var(X。)。( 提 示 : 使 用 附录 和 4 中 OLS 估计 量 





方差 的 同方 差 惟一 的 计算 公式 ) 
b. 证 明 :n var( ĝi TA) 2o var Xa) (提示 :注意 At = X, ,为 什么 ?) 
e. 根据 (a) 和 (b) 中 你 的 答案 ,基于 纯粹 的 有 效 性 考虑 ,在 什么 条 件 下 你 会 选择 差分 再 
差分 估计 重 而 不 选择 差分 估计 量 ? 
1.5 假设 你 有 一 项 实验 的 了 =2 期 (因此 4#=1,2) 的 夯 板 数据 ,考虑 这 样 一 个 面板 数 
据 回归 模型 ,其 中 个 体 效应 和 时 间 效 应 是 固定 的 ,个 体 特征 W, 不 随时 间 的 变化 面 变化 ( tl 
如 性 别 ) 。 假 设 处 理 是 二 元 变量 ,因此 处 理 组 中 的 个 体 在 1=2 t, X, =1 ;省 则 ,XX, =0。 考 虑 
以 下 的 总 体 回归 模型 ; 
Y, =a +B X, +B (D, xW ) +BD, +e, (11.13) 
其 中 ,a, 是 个 体 固定 效应 ;六 是 个 二 元 变量 ,如 果 +=2 ,那么 D,=1, 如 果 t=1, 那 么 ,=0;D, 
x 于 .是 D, 和 于 .之 积 ;a 和 8B 是 未 知 系数 。 假定 AY. = Y, - Y, HBA BEFAR 
(11. 15) (在 单个 回 妇 因子 于 情况 下 ,r=1)。 
11.6 假设 你 拥有 和 练习 11.5 中 的 数据 一 样 的 数据 {两 个 时 期 = 个 观测 值 的 面板 数 
据 ) ,但 物 略 回归 因子 不 。 考 虑 男 一 个 可 供 选择 的 同 归 模 型 : 
Y, =Ë, tX, tG, +BD., + u, (11.14) 
其 中 ,如 果 个 体 在 处 理 组 , 则 G =13; 如 果 个 体 在 控制 组 , 则 C. =0。 证 明 : 公 式 (11.14) 中 局 
的 OLS 估计 量 就 是 公式 (11. 13) 中 的 差分 再 差分 估计 量 。( 提示 :参见 6.3 节 ) 
11.7 推导 公式 (11.9) 中 最 后 一 个 等 式 。{ 提 永 :使 用 协 方差 的 定义 ,以 及 局 ,和 工 
KEALE X, 是 随机 的 而 是 独立 分 布 的 这 一 事实 ) 


[附录 11.1 STAR 项 目 数据 集 | 


可 公共 接触 的 STAR 项 目 数据 集 ,包含 了 从 1985 一 1986 学 年 度 到 1988 一 1989 = E Bë 
的 4 年 实验 期 间 的 考试 成 绩 .处理 组 以 及 学 生 和 教师 特征 的 数据 集 。 本 章 中 所 分 析 的 考试 
成 绩 数 据 是 斯 坦 福 达标 考试 的 数学 和 阅读 部 分 的 成 绩 之 和 。 表 11 一 2 中 的 二 元 变 甚 * 男 
生 " 表 示 学 生 是 男生 ( =1) 还 是 女生 ( =0); 二 元 变量 "黑人 ”和 “ 除 黑 人 或 轨 人 因素 外 的 种 
族 因素 "表示 学 生 种 族 ;二 元 变量 “享有 免费 午餐 资格 "表示 该 学 生 在 这 个 学 年 是 否 享有 多 
费 午 餐 计划 的 资格 。 教 龄 就 是 应 用 考试 数据 的 某 一 年 级 学 生 所 拥有 的 教师 总 教龄 。 该 数据 
集 还 指明 了 在 给 定 的 年 份 里 ,学 生 所 上 的 是 哪 一 所 学 校 , 这 使 得 构造 特定 学 校 的 二 元 指示 变 
量 成 为 可 能 。 


-附录 11.2 差分 再 差分 估计 量 推广 到 多 个 时 期 " 


当 超过 两 个 时 期 时 ,因果 效应 可 用 第 8 章 的 固定 效应 回归 模型 进行 估计 。 
首先 ,考虑 没有 额外 的 回归 因子 “W” 的 情形 ,那么 总 体 回 归 模 型 就 是 合并 的 时 间 与 个 体 
固定 效应 的 回归 模型 {公式 (8. 18)); 
Y. =ñ, +B,X, + yD2, + +y, Dn, +8,B2, +t "+6rBT, +, (11.15) 
其 中 ,i=1,…,n 表示 个 体 ,i =1,… ,7 了 表示 测量 的 时 期 。 如 果 第 i 个 个 体 在 日 期 :已 接受 处 
H, IA X, 1; BWX, =O, D2, 是 表示 第 i 个 个 体 的 二 元 变量 ( 即 如 果 i=2, 那 么 D2 =I; 








D 





T 本 附录 利用 & 3 节 和 8 4 节 的 资料 。 


否则 ,更 , =0), B2, 是 表示 第 2 个 时 期 的 二 元 变量 ,其 他 二 元 变 基 的 定义 类 似 。 是 误差 
项 ,Bo Biy Yab 67 是 未 知 系 数 。 引 人 个 体 效应 (表示 每 个 个 体 的 二 元 变量 ) 控 制 
了 可 影响 了 的 那些 不 可 观测 的 个 体 特性 。 引 入 时 间 效 应 { 表示 时 期 的 二 元 变量 ) 控 制 了 可 
影响 到 实验 结果 的 各 个 时 期 间 的 差异 ,不管 该 个 体 是 在 处 理 组 还 是 在 控制 组 。 例 如 ,在 一 项 
工作 培训 项 目 实验 实施 期 间 发 生 了 经 济 衰 进 , 当 了 =2 时 ,公式 (11.15) 中 的 时 间 与 固定 效 
应 回归 模型 可 简化 为 公式 (11. 14) 中 的 差分 再 差分 回归 模型 。 公 式 (11. 13) 中 局 | 的 估计 方 
法 已 在 8. 4 节 中 做 了 讨论 : 

测 旺 预先 处 理 的 特征 或 测量 不 随时 间 变 化 的 特征 的 额外 回归 因子 (时 ) ,可 以 被 合并 到 
固定 效应 回归 框架 中 。 就 如 在 公式 (11. 5) 上 下 文中 所 讨论 的 ,在 带 有 额外 回归 因子 的 差分 
枉 差 分 设 定 中 ,回归 因子 不 影响 的 是 不 同时 期 了 的 变化 ,而 不 是 其 水 平 值 。 例 如 ,不论 一 个 
个 体 是 否 参 与 了 某 个 工作 培训 项 目 ,该 个 体 以 前 的 教育 水 平 者 是 一 个 可 能 会 影响 政和 人 变化 
的 可 观测 因素 。 因 此 ,为 了 将 公式 (11.5) 推 广 到 多 期 ,回归 因子 太 与 时 间 效 应 二 元 变量 是 
相互 作用 的 。 为 了 方便 起 见 ,假设 只 有 单个 WF 回归 因子 ,那么 公式 (11.5) 的 多 期 推广 形 
AË: 

Y, =B +B X. +8 (B2, x W) +- +B iBT, xW) ty D2, + +y Dn, +8,B2 + +8;BT, +, 

(11.16) 
其 中 ,回归 因子 B2, x W, 是 二 元 变量 B2 和 W. 之 间 的 交互 作用 。 当 只 有 两 个 时 期 时 , 带 有 
个 体 国定 效应 ,时间 效 应 ,回归 因子 W 以 及 与 单个 时 间 二 元 变量 82, 有 交互 作用 的 丈 的 总 
体 加 归 模 型 , 同 公式 (11.5) 中 的 总 体 回归 模型 相同 ( 见 练习 11.5)。 

多 期 面板 数据 也 可 被 用 于 撒 绘 随时 间 变 化 的 因果 效应 ,例如 ,工作 培训 项 目 对 收入 的 效 
应 随 着 时 间 的 推移 是 持续 存在 还 是 消失 了 。 这 样 做 的 方法 ,在 第 13 章 使 用 时 间 序 列 数据 居 
计 却 果 效 应 的 相应 肉 容 中 极 了 讨论 。 











[附录 11.3_ 条 件 均值 独立 性 - 


本 附录 讨论 在 11. 3 节 所 提 到 的 条 件 均 信 独 立 性 假设 及 其 在 对 一 个 普通 处 理 效应 8, 的 


生计 中 的 作用 。 本 讨论 集中 于 带 有 额外 回归 因子 的 差分 估计 量 ( 公 式 (11.2) 中 的 饭 ) ,但 是 
这 里 的 思想 可 推广 到 带 有 额外 回归 因子 的 差分 再 差分 估计 量 中 。 

所 谓 的 条 件 均值 独立 性 { conditional mean independence} 假 设 就 是 指 ,公式 (11.2) 中 
的 误差 项 u, 的 条 件 均 值 可 依赖 于 预先 处 理 的 特征 W... Wa ARR T X, RER 
ME: 

E(u lX W, W )=y +y W. + +y. W. {11. 17) 

在 条 件 均 慎独 立 性 假设 下 ,u, 中 不 可 观测 的 特征 可 能 和 可 观测 的 预先 处 理 的 特征 ( 玉 ) 相 关 ， 
但 是 给 定 W 时, u 的 条 件 沟 值 并 不 依赖 于 这 个 处 理 。 

如 果 W. 是 一 组 完全 的 二 元 指示 变量 ,那么 公式 (11. 17) 中 的 线性 假设 并 不 是 约束 性 
的 。 如 果 变 其 W 是 连续 的 ,那么 公式 (11. 17) 中 的 线性 条 件 期 望 可 被 解释 为 在 适当 重新 定 
义 下 的 情况 下 的 一 个 非 线性 条 件 期 望 。 例 如 ,如 在 6.2 节 中 所 讨论 的 ,公式 (11. 17) 右边 的 
额外 项 可 能 是 -一 个 最 初 连续 变量 W 的 多 项 式 函 数 。 

考虑 公式 (11.17) 成 立 的 三 种 情形 是 很 有 用 的 。 第 一 ,如 果 重 要 慨 念 5.4 中 的 第 一 个 
最 小 二 乘 假设 成 立 ,那么 ECu IX, W... W) =0, 因 此 公式 (11.17) 的 条 件 得 到 江 足 ,并 
且 其 条 件 期 望 等 于 替 。 第 二 ,如 果 这 里 的 处 理 尤 是 被 随机 分 配 的 ,进而 独立 地 分 布 于 所 有 








个 体 的 特征 ,那么 不 论 这 些 特征 是 可 观测 的 已 被 包含 在 回归 中 ( 变量 W) ,还 是 不 可 观测 的 
包含 在 误差 项 中 ,公式 (11.17) 都 成 立 。 如 果 污 独立 分 布 于 和 本 ,那么 给 定 W. #l X. F 
u, 的 条 件 分 布 并 不 依 束 于 XX., 特 别 是 那个 条 件 分 布 的 均值 并 不 依赖 于 X.{ 即使 它 可 能 依赖 
于 多 )。 在 工作 培训 项 目 那 个 例子 中 ,如 果 处 理 是 被 随机 地 分 配 的 ,那么 它 将 不 会 获得 前 置 
教育 水 平 的 效应 ,不 论 教 育 是 一 个 内 会 回归 因子 还 是 误差 项 中 的 遗漏 部 分 。 第 三 ,这 里 的 处 
理 以 W, 为 条 件 被 随和 地 分 配 。 在 此 情形 中 ,wu, 的 均值 不 依赖 于 义 ,, 因为 给 定 到 ,处 理 是 
被 随机 分 配 的 。 如 果 以 V, AAI, H X, 和 是 独立 的 ,那么 给 定 W. F u, 的 条 件 分 布 就 不 
依赖 于 于 ,因此 它 的 条 件 均值 也 不 依赖 于 工 ,即使 它 可 能 依赖 于 Wo mE W, 是 一 组 指示 变 
县 ,那么 条 件 均 值 独立 性 意味 着 在 每 组 内 或 在 指示 变量 所 定义 的 “ 抉 ”内 ,X, 是 被 随机 分 配 
的 ,但 是 这 个 分 配 概率 会 在 不 同 的 块 之 间 变 化 。 在 个 体 所 组 成 的 块 之 内 的 随机 分 配 , 有 时 被 
称 为 块 随机 化 {block randomization ) 。 

在 条 件 均值 很 设 下 ,8, 是 处 理 效应 。 为 了 弄 明 白 这 一 点 ,计算 公式 (11.2) 两 边 的 条 件 
期 望 : 





ELY IX, ,Ws W.) =Ë, +B X. +B Wa +. +B. W. + E(u IX, W... W) 
=a +B. X, +B Fe teo +8.. W. +y, +y W, + +y, Wa (11.18) 
其 中 ,第 二 个 等 式 是 由 条 件 均 值 独立 性 假设 (公式 (11.17)) 导 出 来 的 。 评 价 在 X,=1 处 (处 
理 组 ) 和 在 X=0 处 (控制 组 ) 公 式 (11.8) 中 的 条 件 期 望 并 相 减 ,得 到 : 
ELY IX =1,W,,- W.) -E(Y IX =0,W,,--- W.) =p, (11.19) 
公式 (11.19) 左 边 就 是 在 给 定 特 征 下 下 的 个 体 被 随机 地 分 本 到 处 理 组 和 控制 组 中 的 一 项 实 
验 所 定义 的 因果 效应 ,而 且 该 因果 效应 是 实验 结果 的 期 望 值 。 由 于 这 个 因果 效应 不 依赖 于 
且 , 困 此 它 也 是 总 体 中 一 个 被 随机 选择 的 成 员 的 因果 效应 。 

HARC 17) (连同 重要 概念 5. 4 中 的 第 二 个 到 第 四 个 最 小 二 葬 假 设 ) 成 立时 , 带 有 
额外 回归 因子 的 差分 估计 晤 就 是 一 臻 的。 直观 上 理解 ,通过 引入 W. 作为 回归 因子 ,该 差分 
合计 量 就 控制 了 处 理 概率 会 依赖 于 W. 这 一 事实 。 在 条 件 均值 独立 性 假设 下 ó 是 一 致 的 
这 一 数学 论证 涉及 矩阵 代数 , 留 到 练习 16.9 中 再 做 讨论 。 

条 件 均 值 独立 性 还 提供 了 一 个 解释 带 有 可 观测 数据 回归 的 框架 。 在 这 些 回归 中 ,一 些 
系数 (关于 “控制 "变量 的 ) 并 没有 因果 解释 ,但 其 他 一 些 系 数 却 有 因果 解释 ,如 表 5 一 2 , ¥ 
6 一 3 和 表 ? 一 2 中 的 一 样 。 


附录 11.4” 当 因果 效应 在 个 体 间 变 化 时 的 IV 估计 


本 附录 推导 了 公式 (11. 11) 中 的 TSLS 估计 量 的 概率 极限 ,其 中 ,在 处 理 效 应 和 工具 变 
量 对 处 理 接受 的 影响 中 存在 总 体 异 质 性 。 具 体 来 说 , 假设 不 包括 带 有 异 质 效应 的 公式 
(11.8) 和 公式 (11. 10) 成 立 这 个 条 件 , 重 要 概念 10.4 中 的 IV 回归 假设 成 立 。 进 一 步 假设 : 
Ti 和 Bi 独立 分 布 于 uv, 和 2.,E(w,12,) =E(s1Z,) =0, H Elm) #0, 

朵 于 (了 ,YY ,2,)(i=1,…,n) 是 独立 同 分 布 的 , 且 有 四 阶 矩 ,因此 重要 概念 2.6 中 的 大 
数 定律 适用 。 

















b 


gs -sos 一 一 earvea (11.20) 
《 见 附 录 3.3 和 练习 15.2) 。 所 以 ,这 里 的 任务 就 是 根据 ri, 和 及 .的 窍 获得 rz 和 ez 的 表达 
Re MEM Cp =E[(Z, -pz) (X, -Ar)] = E[ (Z, -uA l HARUL IDRAR Fz 
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时 间 序 列 回归 
与 预测 导论 





时 间 序 列 数据 一 一 即 对 单个 实体 在 多 个 时 点 所 搜集 的 数据 一 一 可 用 来 回答 那些 单 洗 巷 
面 教 据 不 是 以 回答 的 定 重 性 问题 。 举 一 个 这 样 的 问题 :一 个 变量 七 的 变化 对 我 们 所 感 兴 趣 
的 另 一 个 变量 了 随时 间 变 化 的 因果 效应 是 什么 ? 搁 向 话说 , 革 的 变化 对 了 的 动态 因果 效应 
是 什么 ? 例如 ,一 项 要 求 乘客 系 安全 带 的 法 律 ,由 于 司机 从 一 开始 到 后 来 对 该 法 律 有 一 个 适 
应 的 过 程 , 因 此 , 随 著 司机 对 该 法 律 的 逐渐 适应 ,该 法 律 对 交通 死亡 率 的 效应 有 多 大 ? 另 一 
个 这 样 的 问题 是 ,你 对 某 个 变量 在 未 来 某 个 日 期 的 最 佳 预测 值 是 多 少 ? 例如 ,你 对 下 个 月 的 
通货 膨胀 率 、 利 率 或 股票 价格 的 最 住 预测 值 是 多 少 ? 这 两 个 问题 ,一 个 是 关于 动态 因果 效应 
的 问题 , 另 一 个 是 关于 经 济 预测 的 问题 ,它们 都 能 用 时 间 序 列 数据 来 解答 。 但 是 ,时 间 序 列 
数据 存在 一 些 固 有 的 挑战 ,克服 这 些 挑战 需要 一 些 新 的 技术 。 

第 志 章 -第 14 章 介绍 了 时 间 序 列 数 据 的 经 济 计量 分 析 技 术 , 并 将 这 些 技术 应 用 到 预 
测 和 动态 因果 效应 的 估计 问题 中 。 第 12 章 介绍 了 时 间 序 列 数据 回归 的 基本 概念 和 工具 ,并 
将 它们 应 用 于 经 济 预测 。 第 13 章 把 第 12 章 中 所 提出 的 报 念 和 工具 应 用 到 用 时 间 序 列 数据 
估计 动态 因果 效应 的 问题 中 。 第 14 章 着 手 研究 时 间 序列 分 析 中 一 些 更 高 级 的 问题 ,包括 巴 
测 多 元 时 间 序 列 , 对 波动 性 随时 间 变 化 进行 建 模 。 

本 章 所 研究 的 实证 问题 是 预测 通货 膨胀 率 , 即 总 体 价 格 水 平 的 百分比 增加 。 昌 然 在 某 
种 意义 上 说 ,预测 只 是 回归 分 析 的 一 个 应 用 ,但 是 预测 完全 不 同 于 因果 效应 的 估计 ,这 也 是 
本 书 到 目前 为 目的 能 点 问题 。 正 如 在 12. 1 节 中 所 讨论 的 ,对 预测 有 用 的 模型 不 一 定 需要 有 
因果 关系 的 解释 :如果 你 看 到 行人 拿 着 生命, 你 可 能 会 预 测 要 下 雨 , 尽 管 拿 雨 合并 不 会 引起 
下 雨 。12. 2 节 介 绍 了 有 时间 序列 分 析 的 一 些 基本 报 念 ,并 给 出 了 经 济 时 间 序 列 数 据 的 一 些 例 
+, 12.3 节 给 出 了 回归 因子 是 因 变 量 的 过 去 值 的 时 间 序 列 回 妆 模型 ,这 些 " 自 回 知 " 模型 用 
通 赏 膨胀 的 历史 预测 它 的 未 来 。 带 常 ,可 通过 增加 额外 的 预测 因子 变 醒 丰 这 些 变量 的 过 去 
值 或 “滞后 值 " 作为 回 妇 因子 来 改进 以 自 回 好 为 基础 的 预测 ,这 些 所 谓 的 自 回 妆 分 布 滞后 机 
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型 在 12.4 节 中 介绍 ， 例 如 ,我 们 发 现 ,在 做 通货 脱 胀 预测 时 , 除 使 用 通货 膨胀 滞后 值 外 ,我 
们 使 用 失业 率 竟 滞后 全 进行 预测 (也 就 是 以 经 验 的 菲 利 浦 斯 曲线 为 基础 的 预测 ) ,可 以 改进 
自 回 归 通 人 沉 膨胀 预测 。 一 个 实际 问题 是 ,在 自 回 归 模 型 和 自 回 归 分 布 滞后 黎 型 中 包 桥 多 少 
个 过 去 值 汪 是 合适 的 ? 12,5 节 介 绍 了 解决 这 个 问题 的 方法 。 

未 来 与 过 去 是 相 己 的 ,这 是 时 间 序 列 回归 中 的 一 个 重要 假设 ,这 个 假设 有 一 个 特定 的 称 
谓 , 即 “平稳 性 "”。 时 间 序 列 变量 可 能 不 满足 于 不 平稳 性 ,其 原因 是 多 种 多 样 的 ,但 是 在 经 济 
时 间 序 列 数 据 的 回归 分 析 中 有 两 个 原因 非常 重要 :(1) 序 列 可 能 具有 和 桂 续 的 .长 期 的 运动 ， 
即 该 序列 含有 趋势 ;(21) 总 体 回 归 随 时 间 的 推移 可 能 是 不 平稳 的 , 即 总 体 回归 可 能 含有 突 
变 。 这 些 与 平稳 性 的 背离 庆 害 了 基于 时 间 序 列 回归 之 上 的 预测 和 推断 。 幸 和 运 的 是 ,存在 用 
来 发 现 趋势 和 突变 的 统计 方法 ,并 且 一 旦 趋势 和 突变 被 发 现 ,还 存在 调整 模型 设 定 的 统计 方 
法 。 这 些 方法 在 12.6 节 和 12.7 节 中 介绍 。 


12.1 使 用 回归 模型 进行 预测 ]- 


第 4 章 我 们 从 教育 主管 所 考虑 的 一 个 问题 开始 ,该 教育 主管 想 知 道 如 果 她 前 减 其 所 在 
学 区 的 班级 规模 ,那么 考试 成 绩 将 会 提高 多 少 ,也 就 是 说 ,该 教育 主管 想 知道 班级 规模 的 变 
化 对 考试 成 绩 的 因果 效应 。 因 此 ,第 2 部 分 和 第 3 部 分 重点 讨论 了 根据 观测 数据 使 用 回归 
分 桥 方 法 合计 困 果 效应 的 问题 。 

坝 在 券 虑 一 个 不 同 的 问题 ,一 位 家 长 搬 到 一 个 大 城市 并 部 分 地 依据 当地 的 学 区 系统 过 
择 了 该 地 区 内 的 一 个 城镇 。 这 位 家 长 想 知道 ,不 同学 区 在 标准 化 考试 中 的 表现 有 多 大 的 区 
别 。 不 过 ,假设 无 法 得 到 考试 成 绩 数 据 ( 可 能 数据 是 机 密 的 ) ,但 可 获得 班级 规模 的 数据 , 那 
么 ,这 位 家 长 必须 很 据 有 限 的 信息 来 猜测 不 同学 区 在 标准 化 考试 的 中 表现 如 何不 同 。 也 就 
是 说 ,这 位 家 长 的 问题 是 ,根据 与 考试 成 绩 相 关 的 信息 ( 如 班级 规模 ) 来 预 油 其 一 给 定 学 区 
内 的 平均 考试 成 绩 。 

从 概念 上 说 ,这 位 教育 主管 的 问题 和 这 位 家 长 的 问题 完全 不 同 。 多 元 回归 是 解决 这 两 
个 问题 的 一 个 有 力 工 具 , 但 由 于 问题 性 质 不 同 ,因此 用 来 评价 一 个 特定 回归 模型 合适 性 的 标 
准 也 不 同 。 为 了 得 到 那 位 教育 主管 想 要 的 因果 效应 的 可 告 的 估计 值 ,我 们 必须 要 顾 虚 在 第 
7 章 中 所 讨 沦 的 问题 ;遗漏 变量 偏差 问题 选择 问题 . 联 立 因果 关系 问题 等 等 。 相 反 , 要 得 到 
那 位 家 长 想 要 得 到 的 可 车 的 预测 值 ,重要 的 是 所 佑 计 的 回归 要 有 较 强 的 解释 能 力 , 即 所 佑 计 
的 回归 系数 要 精确 ,而 且 该 回归 模型 应 该 是 平稳 的 ,也 就 是 说 ,根据 一 组 数据 集 所 估计 的 回 
归 能 够 可 靠 地 被 用 于 其 他 数据 集 的 预测 。 

例如 ,回想 一 下 第 4 章 介绍 的 考试 成 绩 对 学 生 一 教师 比 (S7R) 的 回归 ; 

TestScore = 698. 9 — 2, 28 x STR (12.1) 

我 们 得 出 的 结论 是 ,这 个 回归 对 回答 该 教育 主管 所 关心 的 问题 是 没有 用 的 :斜率 的 015 
估计 量 是 有 凡 的 ,因为 存在 遗漏 变量 ,诸如 学 生 集体 的 榴 成 和 他 们 其 他 的 校外 学 习 机 会 。 该 
教育 主管 不 能 改变 该 地 区 的 平均 收入 水 平 或 不 说 英语 的 人 数 比 例 ,这 两 个 变量 都 会 影响 考 
试 成 线 。 由 于 这 些 变 重 也 与 班级 规模 相关 ,因此 存在 遗漏 变量 偏差 。 因 而 , 考试 成 绩 对 学 
生 一 教师 比 的 回归 生成 一 个 学 生 一 教师 比 变化 对 考试 成 绩 影响 的 有 偏 佑 计量 ,公式 (12. 1) 
不 能 够 回答 那个 教育 主管 的 问题 。 

不 过 ,公式 (12, 1) 可 能 对 那 位 试图 选择 一 个 学 区 的 家 长 是 有 用 的 。 诚 然 ,班级 规模 并 
不 是 考试 成 绩 的 惟一 决定 因素 ,但 从 家 长 的 角度 来 看 ,重要 的 是 它 是 吾 是 考试 成 绩 的 一 个 可 











重 的 预测 因子 。 对 预测 考 过 成 绩 感 兴趣 的 那 位 家 长 并 不 关心 公式 (12, 1) 中 的 系数 是 否 估 
计 了 得 级 规模 对 考试 成 绩 的 因果 效应 。 更 确切 地 说 ,家 长 只 是 希望 用 该 回归 来 解释 不 同学 
区 考试 成 绩 中 的 大 部 分 变化 ,并 希望 回归 结果 是 平稳 的 ,也 就 是 说 ,家 长 只 是 想 将 回归 的 结 
果 应 用 到 他 们 止 考虑 迁居 的 地 区 。 尽 管 遗 漏 变量 伪 差 使 得 公式 (12. 1) 对 回答 因果 关系 问 
题 是 无 用 的 ,但 它 仍然 可 以 用 于 预测 。 

本 章 中 的 应 用 不 同 于 考试 成 绩 与 班级 规模 之 间 关 系 的 预测 问题 ,因为 本 章 关注 于 使 用 
时 间 序 列 数据 预测 未 米 事 件 , 而 时 间 序 列 预测 在 顾 念 上 类 似 于 那 位 家 长 的 问题 :任务 是 使 用 
某 些 变量 的 已 知 值 { 价格 通货 膨胀 率 的 当期 值 和 过 去 值 ,而 不 是 班级 规模 ?去 预测 另 一 个 变 
基 的 值 (未 来 通货 膨胀 率 , 而 不 是 考试 成 绩 ) 。 像 那 位 家 长 所 关心 的 问题 一 样 ,即使 回归 模 
型 的 系数 没有 因果 解释 能 力 , 该 回归 模型 也 能 生成 可 靠 的 预测 值 。 在 第 13 章 ,我 们 回 到 那 
位 教育 主管 所 面 对 的 问题 ,并 讨论 了 如 何 使 用 时 间 序 列 变量 估计 因果 效应 的 问题 。 


2.2_ 了 时 间 序 列 数据 和 序列 相关 知识 介绍 - 


本 节 介 绍 时 间 序 列 经 济 计量 学 中 出 现 的 一 些 基本 概念 和 术语 。 分 析 任 何 时 间 序 列 数据 
的 一 全 好 的 出 发 点 都 是 绘制 数据 图 形 ,因此 我 们 就 从 绘制 时 间 序列 图 形 开始 。 


12.2.1 美国 的 通货 膨胀 率 和 失业 率 


图 12 一 1(a) 绘 制 了 从 1960 年 到 1999 年 美国 通货 膨胀 率 的 图 形 一 一 由 消费 者 价格 指 
数 (CPH 所 测度 的 美国 价格 水 平 的 年 度 百分比 变化 (在 附录 12. 1 中 描述 了 该 数据 ) 。 通 货 
REKETE 20 世纪 60 年 代 是 低 的 ,在 整个 70 年 代 一 直上 升 ,并 在 1980 年 第 一 季度 ( 即 1980 
年 1 月份.2 月 份 .3 月份) 达到 战 后 最 高 点 15.5% ,而 后 一 直下 降 到 90 年 代 末期 的 3 名 以 
下 。 从 图 12 一 1(a) 中 可 以 看 出 ,通货 膨胀 率 从 一 个 季度 到 下 一 个 季度 可 能 波动 一 个 或 多 个 
BAKO 

图 12 一 1(b) 绘 制 了 美国 失 炎 率 的 图 形 (失业 率 是 指 没有 工作 的 劳动 力 人 口 占 总 劳动 力 
入 口 的 比重 , 它 是 由 美国 的 当前 人 口 调查 提供 的 ( 见 附 录 3.1))。 失 业 率 的 变化 主要 与 美国 
的 经 济 周 期 相 联系 。 例 如 ,在 1960—1961 年 .1970 年 .1974 一 1975 年 的 训 退 期 间 , 在 1980 
年 和 1981-—1982 年 的 双 衰退 期 间 ,以 及 在 1990 一 1991 年 的 训 盟 期间, 失业 率 都 上 升 了 ,由 
图 12 一 1(b) 中 的 阴影 插 条 来 表示 。 


12.2.2 滞后 ,一 阶 差分 ,对 数 和 增长 率 


时 间 序 列 变量 了 在 上 时 期 的 观测 值 表示 为 也 ,观测 值 的 总 数 表 示 为 7。 观测 值 之 间 的 
时 间 间 隔 , 即 第 :期 的 观测 值 和 第 ;+1 期 的 观测 值 之 间 的 时 期 ,通常 是 某 些 时 间 单 位 ,比如 
RAA . 季 (3 个 月 度 单 位 ) 或 年 。 例 如 ,本 章 所 研究 的 通货 膨胀 数据 是 季度 的 数据 ,所 以 时 
间 单 位 (一 个 “时 期 ") 是 一 年 的 四 分 之 一 。 

对 于 工 的 未 来 值 和 过 去 值 ,我 们 用 一 些 专门 的 术语 和 符号 来 表示 。Y 的 前 一 期 的 值 叫 
做 一 阶 滞后 值 (first lagged value) ,或 简称 为 一 阶 滞后 (first lag) , 记 作 了-:。 它 的 第 7 阶 滞 
EEG" lagged value) (或 简称 为 第 j MR U" lag) ) 是 其 在 7 期 以 前 的 值 , 记 为 了.,。 同 
理 , 了 ,| 表示 了 在 将 来 一 期 的 值 。 

Y 的 值 在 第 1: -1 期 和 第 ;期 之 间 的 变化 是 了 -了 ,这 个 变化 被 称 为 变量 了 的 一 阶 差 
分 (first difference) 。 在 时 间 序 列 数据 中 ,“A" 被 用 来 表示 一 阶 差分 ,因此 ,AY = Y,- Y, je 
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分析 经 济 时 间 序 列 数据 经 常 是 在 计算 了 它们 的 对 数 或 其 对 数 的 变化 之 后 才 进行 的 。 这 
pratt EEE eA A H hii cor) MERR 近似 手指 数 形式 的 
增长 ,也 就 是 说 ,在 一 个 较 长 的 时 期 内 , 军 均 不 说 该 序列 倾向 于 每 年 以 一 定 的 百 分 出 增长 ,如 
果 基 这 样 的 省 ,该 序列 的 对 数 就 近似 线性 地 增长 。 秃 一 个 康 因 是 , 许 记 经济 时 间 序 列 的 标准 
闫 与 它们 的 水 乎 值 近似 成 比 合 , 也 就 是 说 ,其 标准 差 可 以 被 很 好 地 表示 为 该 对 应 序列 水 十 
的 百 委 比 , 如 果 是 这 样 的 话 ,那么 该 序 列 堵 几 的 标准 莽 近 似 于 常数。 对 于 以 上 两 种 情况 中 的 
任何 一 种 情况 ,进行 序列 变 搞 部 是 有 用 的 . 它 使 得 变换 后 的 序列 的 变化 与 原始 序列 成 比例 地 


(或 百分比 ) 变 化 ,这 可 以 通过 对 原始 序列 取 对 数 得 到。 中 


重要 概念 12. 1 


滞后 .一 阶 差分 、 对 数 和 增长 率 

图 一 个 时 间 序 列 了 的 一 阶 灌 后 是 了 .3; 它 的 了 阶 滞后 是 了 o 

图 一 个 序列 的 一 阶 差分 AY, ,是 该 序列 在 第 :~ 1 期 和 第 上 期 之 间 的 变化 , 即 AY, =F,- 
Yo 

BF) 的 对 数 的 一 阶 差分 是 Aln( Y,) =In(Y,) ~ln(Y.1)。 

力 一 个 时 间 序 列 Y. 在 第 :-1 期 和 第 :期 之 间 的 百分比 变化 约 为 100Aln( 了) ,这 里 当 百 
分 比 变化 很 小 时 ,近似 程度 最 精确 。 

重要 概念 12. 1 总 结 了 法 后 .一 阶 差分 .对 数 和 增长 率 。 

表 12 一 1 例 示 了 美国 通货 膨胀 率 数据 的 滞后 .变化 和 百分比 变化 。 第 一 列表 示 日 期 或 
时 期 ,其 中 1999 年 第 一 季度 记 为 1999 ; | ,1999 年 第 二 季度 记 为 1999. 工 , 依 此 类 推 。 第 二 
列表 示 该 季度 CPI 的 值 ,第 三 列表 示 通 货 膨 胀 率 。 例 如 ,从 1999 年 的 第 一 季度 到 第 二 季度 ， 
该 指数 从 164.9 增加 到 166.0, 百分比 增加 的 幅度 为 100 x ( 166. 03 - 164. 87)/164. 87 = 
0.704% ,这 就 是 前 后 两 个 季度 间 的 百分比 增加 。 习 惯 上 ,通货 膨胀 率 是 以 年 度 为 基准 报告 
的 (许多 其 他 的 宏观 经 济 时 间 序 列 的 增长 率 也 是 如 此 ) ,以 年 度 为 基准 的 通货 膨胀 率 说 明 ， 
如 果 该 序列 会 持续 以 局 样 的 比率 增加 ,那么 价格 在 一 年 之 中 将 会 上 升 的 百分比 。 因 为 一 年 
有 四 个 季度 ,所 以 在 1999: 正 季度 转换 为 年 度 的 通货 膨胀 率 为 0.704 x4 =2.82 ,或 四 舍 五 人 


之 后 为 每 年 2. 8% 。 
表 12 一 ! 1999 年 和 2000 年 第 一 季度 的 美国 通货 膨胀 


XIE CPI q f re kot: (Ing) (af, À) i eak k fk (à fJ 





H. F EEIE eeka L ñi REA EE CPI 的 百分比 变化 乘 以 4。 道 货 脱 胀 的 一 粉 沾 后 是 
它 在 前 一 季度 的 值 ,而 通货 膨胀 的 变化 是 当前 通货 膨胀 府 减 去 它 的 一 阶 滞后 值 。 所 有 的 数字 都 被 四 合 五 
人 到 一 位 小 数 。 

这 个 百分比 变化 也 可 以 用 重要 概念 12. 1 中 的 对 数 差 分 近似 公式 来 计算 。 从 1999: I 
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差分 , 即 Aln( F.) , Plt, Ain( Y, )=AF7Y,- E 百分比 变化 是 分 数 变化 的 100 £, 因此 ,序列 Y, 的 百分比 变 伦 约 为 100 
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乍 看 起 来 ,通货 膨胀 水 平 值 之 间 强 正 相 关 ,而 通货 膨 情 的 变化 之 间 时 和 负 相 关 , 这 好 像 是 
矛盾 的 ,但 是 ,这 两 个 自 相 关 测 基 的 是 不 局 的 事情 。 通 货 膨 胀 的 强 正 自 相关 反映 了 图 12 一 1 
中 显示 的 通货 膨胀 的 长 期 趋势 :在 1965 年 第 一 季度 ,通货 膨 张 是 低 的 ,而 在 第 二 季度 也 是 如 
此 ;在 1981 年 第 一 季度 ,通货 膨胀 是 高 的 ,而 在 第 二 季度 也 是 如 此 。 相 反 , 通 货 膨胀 变化 的 
负 上 自 相关 意味 着 ,平均 来 看 , 某 个 季度 通货 膨胀 的 上 天 往往 与 下 一 季度 通货 膨胀 的 下 降 相 


表 12 一 2 芋 国 通货 膨胀 率 及 其 变化 的 前 四 阶 样本 自 相关 系数 :1960: | 一 1999: V 
自 相关 系数 
Wir J KEE EC Inf.) 道 货 膨胀 率 变 化 (Af) 





1 0. 85 -0.24 
2 0,77 -0,27 
3 0.77 0.32 
4 0. 68 - 0.06 


12.2.4 经 济 时 间 序 列 的 其 他 例子 


经 济 时 间 序列 大 不 相同 。 图 22 一 2 绘制 了 四 个 不 同 的 经 济 时 间 序 列 的 例子 :美国 联邦 
基金 利率 ,美元 对 英镑 的 汇率 .日 本 实际 国内 生产 总 值 的 对 数 和 标准 普尔 500( S&P500 ) 股 
票 市 场 指 数 日 收 普 率 。 

美国 联邦 基金 利率 ( 见 图 12—2(a)) 是 银行 之 间 相 互 支付 的 隔夜 借款 利率 。 这 个 利率 
是 很 重要 的 ,因为 它 受 美国 联邦 储备 委员 会 控制 ,而 且 是 美联储 的 主要 货币 政策 工具 。 如 果 
将 联邦 基金 利率 图 形 与 图 12 一 1 中 的 失业 率 和 通货 膨胀 率 相 比较 ,你 会 发 现 联 邦 基 金利 率 
的 急剧 上 升 经 常 与 随后 的 塞 退 相 联 系 。 

美元 /英镑 汇率 ( 见 图 12 一 1(b)) 是 1 英镑 (2 的 美元 价格 。 在 1972 年 以 前 ,发 达 国 家 
实行 固定 汇率 制度 ,被 称 为 “布雷 顿 森林 ”体系 ,在 该 体系 下 ,政府 的 工作 是 防止 汇率 波动 。 
在 1972 年 ,通货 膨胀 的 压力 导 孝 了 “布雷 顿 森林 ”体系 的 崩溃 ,随后 ,一 些 主要 的 货币 允许 
“浮动 ”, 也 就 是 说 ,它们 的 价值 由 外 汇市 场 上 货币 的 供求 来 决定 。 在 1972 年 以 前 ,汇率 几 
平 是 常数 , 除 1968 年 惟一 一 次 贬值 外 , 当时 英镑 相对 美元 的 官方 报价 跌 至 2. 40 美元 。 自 
1972 年 以 来 ,汇率 已 在 一 个 非常 广 的 范围 内 波动 。 

日 本 实际 季度 CDP( M.E] 12 一 2(e ) ) 是 经 通货 膨胀 调整 后 , 在 一 个 季度 内 日 本 所 生产 
的 商品 和 服务 的 价值 总 和 。GDP 是 总 体 经 济 活动 的 最 广泛 的 测量 指标 。 图 12 一 2 人 ec) 绘制 
了 该 序列 的 对 数 ,这 个 序列 的 变化 可 被 解释 为 (小 数 的 ) 增 长 率 。 在 20 世纪 6 年 代 和 70 年 
代 初 期 ,日 本 实际 GDP 增长 迅速 ,但 这 种 增长 在 70 年 代 后 期 和 80 年 代 却 缓慢 下 来 。% 年 
代 期 间 ,增长 进一步 减缓 ,从 1990 一 1999 年 ,年 均 增 长 率 仅 为 1.5 久 。 

纽约 股票 交易 所 (NYSE) 股票 价格 指数 日 收益 率 ( 见 图 12 一 2(d) ) 是 NYSE 综合 市 场 
指数 从 一 个 交易 日 到 下 一 交易 日 的 百分比 变化 ,该 指数 是 在 纽约 股票 交易 所 交易 的 所 有 公 
司 股票 价格 的 一 个 最 宽泛 的 指数 。 图 12 一 2(d) 绘 制 了 从 1990 年 1 月 2 日 到 1998 年 12 月 
31 自 ( 共 1771 个 观测 值 ) 的 日 收益 率 图 形 。 不 像 图 12 一 2 中 的 其 他 序列 ,在 这 些 日 收益 率 
序列 中 几乎 不 存在 序列 相关 ,如果 存在 ,那么 你 就 可 以 使 用 过 去 的 日 收益 率 来 预测 这 些 收 益 
率 ,并 且 能 够 通过 在 预测 市 场 开 始 上 涨 时 买 人 而 在 预测 市 场 开始 下 跌 时 卖 出 来 赚钱 。 尽 管 
收益 率 本 身 在 实质 上 是 不 可 预测 的 ,但 通过 对 图 12 一 2(d) 的 检查 ,可 以 揭示 收益 率 波 动 的 











某 些 模式 。 例 如 ,收益 率 的 标准 差 在 1991 年 和 1998 年 相对 较 大 ,而 在 1995 年 相对 较 小 。 
这 种 "波动 集聚 现象 " 在 许多 金融 时 间 序 列 中 被 发 现 ,对 这 种 特殊 类 型 蜡 方差 序列 进行 建 模 
的 经 济 计 基 模型 在 14. 5 节 中 进行 了 研究 。 
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注 :这 四 个 时 间 序 列 具有 明显 不 同 的 图 形 。 联 邦 基金 利率 { 见 图 12 一 2(a) ) 有 一 个 与 价格 水 平 通 货 
膨胀 类 已 的 图 形 。 美 元 和 英镑 之 间 的 汇率 ( 见 图 12 一 2(b) ) 显 示 了 在 1972 年 固定 汇率 的 布雷 顿 森 林 栖 
系 展 溃 之 后 的 离散 变化 。 日 本 实际 GDP 的 对 数 ( 见 图 12 一 2(e)) 表现 出 相对 平滑 的 增长 ,尽管 增长 率 
在 加 世纪 ?0 年 代 是 下 降 的 ,并 且 在 入 年 代 再 一 次 下 降 。NYSE 股票 价格 指数 日 收益 率 ( 见 图 12 一 2 
(d) ) 在 本质 上 是 不 可 预测 的 ,但 它 的 方差 是 变化 的 ,这 个 序列 表现 出 “波动 集聚 "现象 。 

图 12—2 四 个 经 济 时 间 序 列 





-12.3 BEH) 


明年 的 价格 水 平 通 货 脱 胀 率 ( 即 总 体 价 格 水 平 的 百分比 增加 ) 将 是 多 少 ? 华尔街 的 投 
资 者 在 决定 对 债券 投资 支付 多 少时 要 依 舍 通 货 膨 胀 的 预测 。 像 美国 联邦 储备 银行 这 样 的 中 
央 银 行 的 经 济 学 家 在 制定 货币 政策 时 要 使 用 通货 膨胀 预测 ,企业 在 预测 产品 销售 时 要 使 用 
通货 膨胀 预测 ,地 方 政府 在 制定 来 年 财政 预算 时 也 要 使 用 通货 膨胀 预测 。 在 本 节 中 ,我 们 考 
虑 使 用 自 回 归 (autoregression) 所 做 的 预测 , 自 回 归 是 一 个 将 时 间 序 列 变量 和 它 的 过 去 值 
联系 在 一 起 的 间 归 模型 。 


12.3.1 一 阶 自 回归 模型 
如 果 你 想 要 预测 一 个 时 间 序 列 的 未 来 值 ,一 个 好 的 出 发 点 是 考察 它 刚刚 过 去 的 邻近 的 
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值 。 例 如 ,如 果 你 要 预测 这 个 季 尊 到 下 个 季 谨 通货 膨 帐 的 变化 ,那么 你 可 以 看 看 上 个 季度 通 
货 庶 胀 是 上 升 了 还 是 下 降 了 。 利 用 前 一 个 季度 通货 膨胀 的 变化 Ar ,来 预测 本 季度 通货 
膨胀 的 变化 Alnj. ，- 个 系统 的 方法 就 是 估计 Ai 对 Anf, A9 OLS 回归 。 利 用 从 1962 一 
1999 年 的 数据 进行 估计 ,所 得 的 里 归 方 程 是 ; 


— 
Al = 0.02 - DUE Anf, (12.7) 
(0.14) (0.106) 


其 中 ,和 通常 一 样 ,标准 误 在 估计 系数 下 面 的 括号 中 给 出 ,和 下 是 以 所 估计 的 回归 线 为 基础 
的 Amf 的 预测 值 。 公 式 (12. 7) 中 的 模型 被 称 为 一 阶 自 回归 ,之 所 以 被 称 为 自 回归 ,是 因为 
它 是 序列 对 它 自身 的 于 后 值 Ainf_, 的 回归 ;而 之 所 以 被 称 为 一 阶 , 则 是 因为 只 使 用 一 个 涡 
后 值 作为 四 归 因 子 。 公 式 (12.7) 中 的 系数 是 负 的 ,因此 一 个 季度 通货 膨胀 率 的 上 升 往往 伴 
随 着 下 一 个 季度 通货 膨胀 率 的 下 降 。 

一 阶 自 回归 被 简 记 为 AR(1) ,其 中 “1" 表明 它 是 一 阶 的 。 序 列 Y, 的 总 体 AR) 
型 是 ; 

Y = +B Y, +u, (12.8) 
其 中 , 是 误差 项 。 

预 济 与 预测 误差 。 假 设 你 有 关于 了 的 历史 数据 ,并 且 你 想 要 预测 它 的 未 来 值 。 如 果 Y, 
满足 公式 (12.8) 中 的 AR(1) 模 型 是 B86, 和 局 是 已 知 的 ,那么 基于 了 .1 的 了 的 预测 值 为 B+ 
B.Y, Io 

在 实际 中 ,BB 和 8B, ERAN, IB W.W 18 S 3 8 AEH 8, fi p, 进行 估计 。 我 们 将 使 用 
OLS iiti Â, 和 房 ,它们 是 使 用 历史 数据 构造 出 来 的 。 一 般 地 说 ,利用 直到 ! - 1 期 的 数据 
所 佑 计 的 模型 ,多 ;表示 在 直到 + -1 期 的 信息 基础 上 工 的 预 浏 慎 。 因 此 ,以 公式 (12.8) 中 
的 AR(1) 模 型 为 基础 的 预测 是 .; 

fu =Â +Â Ya (12.9) 
其 中 记 AÂ 是 利用 直到 + -1 期 的 历史 数据 估计 出 来 的 。 

预测 误差 forecast error) 是 预测 所 犯 的 错误 , 它 是 实际 发 生 的 7 的 值 与 根据 了 -做 出 

的 了 的 预测 值 之 差 。 
预测 误差 = 了 -Ên (12.10) 

预测 与 预测 值 。 这 里 所 说 的 预测 并 不 是 一 个 OLS 预测 值 ,这 里 所 说 的 预测 误差 也 并 不 
是 指 OLS 残 差 。OLS 预测 值 是 为 估计 回归 的 那些 在 样本 中 的 观测 值 而 计算 的 。 相 反 ,预测 
值 是 为 用 于 估计 回归 的 数据 集 以 外 的 某 些 时 期 而 做 的 ,因此 ,所 预测 的 因 变量 的 实际 值 的 数 
据 不 在 用 来 估计 该 回 妇 的 样本 数据 中 。 同 理 ,OLS 残 差 是 了 的 实际 值 与 它 在 样本 内 观测 值 
的 预测 值 之 差 ,而 预测 误差 是 指 了 的 未 来 值 ( 它 不 包含 在 估计 样本 中 ) 与 该 未 来 值 的 预测 什 
之 差 。 换 名 话说 ,预测 和 预测 误差 (forecasts and forecast errors) 从 属于 “样本 外 "观测 值 ,而 
预测 值 和 残 差 (predicted values and residuals) 从 属于 “样本 内 ”观测 值 。 

BARUR., 均 方 根 预 测 误差 (root mean squared forecast error, 简写 为 
RMSFE ) 是 预测 误差 大 小 的 一 个 测量 ,也 就 是 说 , 它 是 使 用 某 一 预测 模型 所 犯 的 错误 大 小 
的 一 个 测量 指标 。RMSFE 是 均 方 预测 误差 的 平方 根 。 


RMSFE =/ EL (Y, - F. ..)2]1 (12.11) 


RMSFE 有 两 个 误差 来 源 : 一 个 是 因 u, 的 未 来 值 是 未 知 时 所 引起 的 误差 ,一 个 是 在 估计 














系数 8。 和 局 时 所 产生 的 误差 。 如 果 第 一 个 来 源 的 误差 远大 于 第 二 个 (如 果 样 本 容量 很 大 
时 就 可 能 出 现 这 种 结果 ) ,那么 RMSFE 近似 等 于 总 体 回 归 { 见 公式 {12.8)) 中 误差 项 ,的 
标准 差 yvar(w,)。 反 过 来 ,u KERE Æ HEH (SER, W, 5. 10 节 ) 的 标准 误 估计 出 来 的 。 
因此 ,如 果 由 估计 回归 系数 所 引起 的 不 确定 性 小 得 足以 被 忽略 ,那么 RMSFE 就 可 以 由 回归 
的 标准 误差 来 估计 。12. 4 节 中 研究 了 包含 两 个 预测 误差 来 源 的 RMSFE 的 估计 。 

在 通货 距 胀 案例 中 的 应用 ”根据 公式 (12.7) 中 所 估计 的 AR RN E EAA 
1999 :下 的 数据 来 估计 的 ) ,预测 者 在 1999 :下 就 已 应 做 出 的 2000 年 第 一 季度 (2000; 上 ) 的 
通货 及 胀 预测 值 是 多 少 ? 由 表 12 一 ! 可 知 ,1999; 开 的 通货 脱 胀 率 为 3.2 名 (因此 ,nyoo = 
3.2% ) , 比 1999: 耳 增加 0.4 个 百分点 (因此 ,Ainfis n =0.4)。 将 这 些 值 代 人 公式 (12.7)， 
从 1999; IV #| 2000; 通货 膨胀 变化 的 预测 值 为 Ajny oo; =0.02 -0.211 x Afnf,ss n =0.02 
-0.211 x0.4 = - 0.06~ -0.1( 四 舍 五 人 到 十 位 )。 道 货 脱 胀 率 的 预测 值 为 道 货 脱 胀 率 的 
过 去 值 加 上 预测 的 变化 值 : 

fafaa = + BI, (12.12) 
因为 jnfiow ny =3. 2% , M 1999; N Af 2000; [ 8 be ik hu WI Aa k 18 E: -0.1, 所 以 2000; I 
0938 E BE Jk së B TENJH E TZ; = Inf + AnP =3 2% -0.1% =3,1%。 因 此 ， 
AR(1) 模 型 预测 出 该 通货 膨胀 将 由 1999; IV 893. 2% a TEER] 2000: L 893. 1%. 

这 个 AR(1) 预测 值 的 精确 度 如 何 ? 由 表 12 一 1 可 知 ,2000; I 通货 膨胀 的 实际 值 为 
4.1% ,这 样 AR(1) 预测 值 整整 低 了 1 个 百分点 , 即 预 测 误差 是 1.0%。 公 式 (12.7) 中 的 
AR(1) 模 型 的 民 仅 为 0.04, 所 以 灌 后 的 道 货 膨胀 变化 只 解释 了 用 来 拟 合 自 回 归 样 本 中 通 
货 膨 胀 变化 的 非常 小 的 部 分 。 这 个 低 的 下 值 与 用 公式 (12.7) 所 生成 的 那个 较 差 的 2000; 
I 通货 膨胀 预测 值 是 一 致 的。 更 一 般 地 说 , 低 的 R' 值 表明 ,这 个 AR(1) 模 型 只 能 预测 通货 
蜗 胀 变化 中 的 一 小 部 分 变化 。 

公式 (12.7) 的 回归 标准 误 为 1. 67。 如 果 忽 略 由 系数 估计 所 引起 的 不 确定 性 ,那么 对 以 
公式 (12.7) 为 基础 的 预测 值 ,RMSFE 的 佑 计 值 为 1. 67 个 百分点 。 


12.3.2 pi BERRE 


AR(1) 模 型 使 用 了 .来 预测 ,但 是 这 样 做 忽略 了 在 更 远 的 过 去 所 潜在 的 有 用 的 信息 ，; 
综合 考虑 这 些 信 息 的 一 种 方法 是 ,在 AR(1) 模 型 中 包含 额外 的 灌 后 项 ,这 就 得 到 了 p Br Ë 
回归 模型 ,或 称 AR p) RM, ' 

p 阶 自 回 归 模 型 { p" order autoregressive model, 或 称 ARI p) 模型} 将 Y 表示 为 它 的 p 
个 灌 后 值 的 线性 函数 , 即 在 AR(p) 模 型 中 ,回归 因子 是 ,Ys，…,-。 和 一 个 截 中 项 。 包 
含 在 AR(P) 模型 中 的 滞后 数 p, 被 称 为 自 回归 的 滞后 阶 数 或 滞后 长 度 。 

例如 ,通货 路 胀 变化 的 AR(4) 模 型 用 通货 膨胀 变化 的 四 阶 滞 后 作为 回归 因子 。 用 OLS 
对 1962 一 1999 年 的 数据 进行 估计 ,所 得 的 AR(4) 模 型 为 


— 
åhf, = 0.02 - 0.21 Amf,- 9.32 Alf, + 0.19 Anf_,- 0.04 Anf, (12.13) 
(0.12) (%10 f (009) 7 (009) WY (010) 


公式 (12. 13) 中 的 最 后 三 个 额外 灌 后 项 的 系数 在 5% 的 显著 性 水 平 下 联合 地 显著 异 于 0: 了 
统计 量 是 6. 43{p 值 <0.001)。 这 反映 在 尼 值 由 公式 (12.7) 中 AR(1) 模 型 的 0.04 提高 到 
AR(4) 模 型 的 0.21 上 。 同 理 ,公式 (12. 13) 中 AR(4) 模 型 的 SER 为 1.53, 比 AR(1) 模 型 的 
SER 值 1. 67 有 所 改进 。 


AR(P) 模 型 在 重要 概念 12. 3 中 总 结 。 


重要 概念 12. 3 
自 回 妇 
p 阶 咎 回归 模型 将 Y, 表示 为 它 的 已 个 灌 后 值 的 线性 函数 ， 
Y, =A +B,Y,. A +8,Y, a + +BY, ,+ (12.14) 


其 中 ,天 (z17 Y...) =0。 洁 后 数 p RERA A EARR rak aki EE. 

A&BRCp) 模 型 中 预测 和 误差 项 的 性 夺 。 纵 定 Y 的 过 去 值 ,u 的 条 件 期 望 为 0( 即 ECx,1 
Yo Pano F...) =0) 这 个 假设 具有 两 个 重要 的 含义 。 

第 一 个 含义 是 ,基于 了 的 全 部 历史 值 所 做 出 的 它 的 最 佳 巴 测 只 依赖 于 最 近 的 p 个 过 去 
值 。 具 体 地 讲 , 令 Y. SEIF o Yaon o ARE Y, KNA D EERE T Y, 的 条 件 均 
值 ,那么 在 基于 了 的 历史 值 的 所 有 预测 中 ,了 ,| 具有 最 小 的 RMSIFE( 见 练习 12.5)。 如 果 工 
满足 AR(p) ,那么 它 的 条 件 均 值 为 : 

了 =B +B YT +BY, ate +8,Y,_, (12.15) 

它 是 从 公式 (12. 14) 中 的 AR(p RWA E(u, Y,a, Y 200) =0 的 假设 中 得 出 的 。 实 际 上 ， 

系数 记 ,6 ,…,B, 是 未 知 的 ,因此 ,由 AR(p) 得 出 的 实际 预测 值 需 要 使 用 带 有 估计 系数 的 公 
式 (12. 15)。 

第 二 个 含义 是 ,误差 项 u, 是 序列 不 相关 的 ,这 是 由 公式 (2.25) 中 得 出 的 结论 ( 见 练习 
12.5). 

在 通货 脱 胀 案例 中 的 应 用 。 根据 公式 (12. 13 ) 中 通货 膨胀 的 AR(4) 模 型 ,使 用 直到 
1999 ,到 的 数据 ,2000 : 王 通货 膨胀 的 了 预测 值 是 老少 ? 为 了 计算 这 个 预测 值 ,将 1999 年 四 个 
季度 的 每 一 个 季度 的 通货 膨胀 变化 值 代 人 公式 (12.13 ) H: Kia rss = 0.02 - 
0. 21 Af, y — 0. 32 no +019Apho g — 0. Anfo; =0.02 -0.21 x0.4 -0.32x 
0.04+0 19xL1-004x( -0,4) =0, 2 , £ IE 1999 438 481284 [Ë E AZ 12 一 1 的 最 后 
一 列 。 

相应 的 2000. [的 通货 膨胀 的 预测 值 是 1999: 区 的 通货 膨胀 值 加 上 预测 的 变化 值 , 即 
3.2% +0.2% =3.4 掏 。 预 测 误差 为 实际 值 4. 1 多 减 去 预测 值 , 即 4.1 锡 ~3.4 =0.7% E 
小 于 ARt1) 的 预测 误差 1.0 免 。 


12.4 ”含有 额外 预测 因子 的 时 间 序 列 回 归 与 
自 回归 分 布 滞后 模型 


经 济 理论 常常 建议 ,其 他 一 些 变量 在 预测 我 们 所 感 兴趣 的 变量 时 也 会 有 所 帮助 。 这 些 
其 他 的 变量 ,或 称 预测 因子 ,可 被 添加 到 一 个 自 回归 中 生成 一 个 含有 多 个 预测 因子 的 时 间 序 
列 回归 模型 。 当 其 他 的 变量 及 其 滞后 项 被 添加 到 一 个 自 回归 中 时 ,其 结果 就 是 一 个 自 回归 
分 布 泗 后 模型 。 


12.4.1 利用 过 去 的 失业 率 预 测 通货 膨胀 率 的 变化 


高 的 失业 率 值 倾向 于 与 未 来 通货 膨胀 率 的 下 降 有 联系 。 这 种 负 的 相关 关系 , 即 著名 的 
短期 非 利 浦 斯 曲线 ,在 散 点 图 12 一 3 中 看 得 很 清楚 ,图 中 价格 通货 膨胀 率 的 年 度 变 化 对 应 于 














上 一 年 度 的 失业 率 。 例 如 ,1982 年 平均 失业 率 为 9. 7 多 ,在 下 一 年 通货 膨胀 率 下 降 2 9 名 。 
大 体 来 说 ,图 12 一 3 中 的 相关 系数 为 ~0. 40。 
第 ! 年 至 第 m1 年 的 通货 脱 胀 变化 





0 2 4 6 8 10 12 
第 :年 的 失业 率 


注 ;1982 年 ,美国 失业 率 为 9. 7% , H. 1983 年 的 通货 膨胀 率 下 降 2.9 名 (最 大 的 点 )。 一 般 地 说 ,! 年 
的 高 失业 率 值 懒 向 于 紧 接 着 在 下 一 年 即 :+1 年 有 价格 水 平 通货 脱 服 率 的 下 降 , 且 相关 系数 为 -0 40。 
图 12 一 3 :与 +1 年 之 间 通货 膨胀 变化 和 :年 失业 率 的 散 点 图 
图 12 一 3 中 的 散 点 图 表明 ,失业 率 的 过 去 值 可 能 包含 了 关于 通货 膨胀 未 来 进程 的 信息 ， 
而 这 些 信息 并 没有 包含 在 通货 膨胀 的 过 去 变化 中 。 这 个 推测 通过 扩展 公式 (12. 13 ) 中 的 
AR(4 模型 把 失业 亭 的 一 界 江 后 包含 进来 就 很 容易 检验 : 


Bm = LQ - 026 A 040 Ab, + OU Amf,- 009 Anf,- 023 Demp (I2 16 
(055) (009) Ha- (0. 10) Wt 08) Ws (0 10) Wis (0. 10) . (210) 


Unemp,_, ËJ 统计 其 为 -2.33 ,因此 ,这 个 项 在 5 镶 的 水 平 下 是 显著 的 。 这 个 回归 的 站 
30.22, AR(4) 6} R0. 21 稍 有 改善 。 

将 1999 年 通货 膨胀 的 变化 值 连同 1999; 的 失业 率 的 值 (4.1 免 ) 一 起 代 人 公式 
(12. 16) 中 , 便 可 得 到 2000; I 通货 膨胀 变化 的 预测 值 ,所 得 的 预测 值 为 Anjoo rum. Ü. 5. 
因此 ,2000: 工 通货 膨胀 的 预测 值 是 3. 2% +0.5% =3.7% ,预测 误差 是 0.4%。 这 个 预测 值 
比 AR(4) 的 预测 值 更 接近 于 2000; I 的 实际 通货 膨胀 水 平 。 

如 果 失 业 率 的 一 阶 滞后 有 助 于 预测 通货 膨胀 ,那么 多 阶 灌 后 可 能 是 更 有 帮助 的 。 再 增 
加 三 个 更 高 阶 的 失业 率 汪 后 项 ,相应 的 估计 结果 如 下 : 


na 
Aif = 1.32 - 0.36 Aif- 0.34 Al 0.07 Alf, - LB am. 
(0.47) (0.09) i-i (0.10) Miaa t (0. 08) mf ‘ 
_- 2.68 Unemp,_ + Unemp, a- 1.04 Unemp,_ pa Unemp,_, (12.17) 
(0.47) ` (0.89) (0.89) ` (0.44) 


检验 二 至 四 阶 失业 率 滞后 项 的 联合 显著 性 的 下 统计 量 为 493(p t =0.003) ,因此 它 
们 是 联合 显著 的 。 公 式 (12.17) F EHH R 为 0.35, 比 公式 (12.16) 的 0 22 有 实质 性 改 
善 。 所 有 失业 率 系 数 的 政 统 计量 是 8. 51(p 值 <0.001), 这 表明 了 该 模型 比 12.3 TAA 
(12. 13) ) 中 的 AR(4) 模 型 在 统计 上 有 了 显著 的 改善 。 会 式 (12.17) 中 回 妇 的 标准 误 为 
1.37, 比 AR(4) 中 的 SER1. 53 有 了 较 大 改善 。 

利用 公式 {12. 17) ,从 1999: 到 2000: 工 通货 膨胀 变化 的 预测 值 可 通过 将 相应 变量 的 
值 代 入 到 方程 中 进行 计算 。1999: I 和 1999; 工 的 失业 束 为 4 3 ,1999, 焉 的 失业 率 为 


4.2% ,1999; 国 的 失业 率 为 4.1%。 根据 公式 (12.17) ,从 1999; V gj 2000: 工 通 货 膨 胀 变化 
的 预测 值 为 : 
rss 11199 w = [.32 -0.36 x0.4 -0.34 x0.0 +0,07 x1.1 -0 03 x ( -0.4) 
一 2.68 x4. 1 +3.43 x4.2 - 1.04 x4.3 +0. 07 x4. 3 (12,185 
=Ü, 5 

因而 ,2000: 1 通货 膨胀 的 预测 值 为 3.2% +0.5% =3.7%, MARES, 0. 480. $ 
来 ,增加 失业 率 的 多 和 阶 汪 后 项 改善 了 通货 脱 胀 的 预测 值 , 它 比 AR(4) 的 通货 膨胀 预测 值 要 
好 一 些 。 

白 男 归 分 布 滞后 模型 。 公 式 (12.16) 和 公式 (12.17) 中 的 模型 就 是 自 回 归 分 布 滞后 
(autoregressive distributed lag ,简写 为 ADE) 模 型 ;之 所 以 被 称 为 “ 自 回归 的 ”, 是 因为 因 变 
量 的 灌 后 秆 作为 回归 因子 被 包含 进来 了 ;之 所 以 被 称 为 “分 布 洪 后 " ,是 因为 回归 方程 中 还 
包含 了 一 个 额外 预测 因子 的 多 阶 滞后 项 {“ 分 布 滞后 ”) 。 一 般 地 说 ,将 含有 因 变 量 了 的 p 
阶 澡 后 和 一 个 额外 预测 因子 郊 的 4 阶 滞后 的 身 回 归 分 布 滞后 模型 , 称 为 ADL p,9)。 用 这 
种 符号 表示 ,公式 {12. 16) 中 的 模型 应 该 是 ADL(4,1) 模 型 ,而 公式 (12. 17) 中 的 模型 应 该 是 
ADL (4,4) 模 型 。 

自 回 归 分 布 滞后 模型 在 重要 概念 12.4 中 总 结 。 如 果 有 所 有 这 些 回归 因子 ,那么 公式 
(12. 19) 中 的 符号 就 显得 有 点 兄长 哪 嗪 ,附录 12.3 根据 所 谓 的 滞后 算 子 给 出 了 另 一 种 可 选 
择 的 符号 表示 方法 。 

给 定 了 和 瑟 的 所 有 过 去 值 ,ADL 模型 中 的 误差 项 具有 条 件 零 均值 的 假设 , 即 E(u,1 
了 了) =0, 这 个 假设 意味 着 ,在 ADL 模型 中 没有 包含 了 或 苇 的 额外 滞 
后 项 。 换 名 话说 ,滞后 长 度 p 和 9 是 真实 的 河 后 长 度 ,其 他 沼 后 项 的 系数 为 0。 

ADL 模型 包含 有 因 变 量 的 滞后 项 { 自 回归 成 分 ) 和 单个 额外 预测 因子 三 的 一 个 分 布 济 
后 项 。 然 而 一 般 地 说 ,可 以 通过 使 用 多 个 预测 因子 来 改善 预测 值 。 但 是 ,在 转 到 含有 多 个 预 
测 因 子 的 一 般 时 间 序 列 回 归 模 型 之 前 ,我 们 首先 介绍 平稳 性 这 个 概念 , 它 将 在 后 面 的 讨论 中 
用 到 。 


重要 概念 12. 4 








自 回归 分 布 滞后 模型 
含有 了 的 p RGI X, 的 9 阶 滞后 项 的 自 回 归 分 布 滞后 模型 ADL(P,9) 是 : 
Y, =, +BY, +BY,- + +B, Yep LEP ARE *+6,X,., + T X... +u, (12.19) 
其 中 ,记忆 及, 页 ,…,8 是 未 知 系数 ,w 是 满足 Elu Y, Y. Y. X, ) = 
0 的 误差 项 。 


12,4.2 平稳 性 


时 间 序 列 数据 的 回归 分 析 必 然 要 用 来 自 过 去 的 数据 来 量化 历史 关系 。 如 果 未 来 与 过 去 
相似 ,那么 就 可 以 用 这 些 历史 关系 预测 未 来 。 但 如 果 未 来 根本 不 同 于 过 去 ,那么 这 些 历 史 关 
系 可 能 不 是 认识 未 来 的 可 靠 指导 。 

在 时 间 序 列 回归 的 范畴 中 ,将 历史 关系 推广 到 未 来 这 个 思想 ,已 经 用 平稳 性 
| stationarity 概念 进行 公式 化 。 平 稳 性 的 精确 定义 (在 重要 概念 12.5 中 给 出 ) 是 ,时 间 序 列 


T 原 交 为 0.4 一 一 译 者 注 。 














变量 的 分 布 不 随时 间 的 变化 而 变化 。 
12.4.3 含有 多 个 预测 因子 的 时 间 序 列 回 归 


含有 多 个 预测 因子 的 -- 般 的 时 间 序 列 回归 模型 ,是 将 ADL 模型 加 以 推广 ,包含 了 多 个 
预测 因子 ,以 及 这 些 预 测 因子 的 滞后 项 。 关 于 这 个 模型 ,在 重要 概念 12.6 中 做 了 总 结 。 由 
于 多 个 预测 因子 及 其 河 后 项 的 存在 ,我 们 必须 用 双 下 角 标 表示 回归 系数 和 回归 因子 。 


重要 概念 12. 5 


平稳 性 

如 果 一 个 时 刊 序列 Y, 的 概率 分 布 不 随时 间 的 变化 而 变化 ,也 有 即 如 时 (了 ,YY,,,，*…， 
,rz 的 联合 分 布 不 依赖 于 *, 那 么 它 就 是 平稳 的 { stationary ) ,否则 ,就 称 了 是 不 什 稳 的 
(nonstationary), XF TAII EFS] AX, 和 和 节 , 如 果 ( 下 了 五 芋 rr 的 
联合 分 布 不 依赖 于 *, 那 么 就 称 他 们 是 联合 平稳 的 (jointly stationary), FREER, RES 
过 去 对 少 在 概率 意义 上 是 相似 的 。 

时 间 序 列 回 归 模 型 假设 。 对 时 间 序 列 数据 而 言 ,重要 概念 12. 6 中 的 假设 修改 了 截面 数 
据 多 元 回归 模型 的 四 个 最 小 二 乘 假设 { 见 重要 概念 5.4)。 

第 一 个 假设 是 ,给 定 所 有 的 回归 因 季 以 及 包含 在 回归 模型 中 的 滑 后 项 以 外 的 这 些 回归 
因子 的 滞后 项 ,z 有 条 件 零 均值 。 这 个 假设 扩展 了 在 AR 和 ADL 模型 中 所 用 到 的 假设 ,并 
隐 含 着 这 样 的 结论 ,利用 了 和 的 所 有 过 去 值 ,了 的 最 佳 预 测 值 由 公式 (12.20) 中 的 回归 
给 出 。 

截面 数据 的 第 二 个 最 小 二 乘 假设 ( MEER 5.4). (X... X. E) il, en E 
独立 同 分 布 的 (ii d.) 。 时 间 序 列 回 归 的 第 二 个 恨 设 用 一 个 含有 两 个 部 分 的 更 恰当 的 很 设 
RET iid 假设 。 部 分 (a) 是 ,数据 取 自 于 一 个 平稳 的 分 布 ,这 样 该 数据 在 今天 的 分 布 与 
其 在 过 去 的 分 布 相同 。 这 个 假设 是 i.i. d. 假设 的 “ 同 分 布 "部 分 的 时 间 序 列 形式 :每 个 抽样 
为 同 分 布 的 截面 性 要 求 条 件 被 这 些 变量 { 包 描 汪 后 项 ) 的 联合 分 布 不 随时 间 变 化 而 变化 的 
时 间 序 列 事 求 条 件 所 代替 。 实 和 际 上 ,许多 经 济 时 间 序 列 看 上 去 嘎 不 平稳 的 ,这 意味 着 这 个 假 
设 在 应 用 中 并 不 成 立 。 如 果 时 和 间 序 列 变 量 是 不 平稳 的 ,那么 在 时 间 库 列 回 归 中 会 出 现 一 个 
或 更 多 个 阅 题 ,预测 结果 可 能 是 有 偏 的 ,预测 结果 可 能 号 无 效 的 (根据 同样 的 数据 ,可 能 存 
在 具有 较 低 方差 的 另外 的 预测 值 ) ,或 常规 的 基于 OLS 的 统计 推断 (例如 ,通过 比较 OLS: 统 
计量 和 +1, 96 来 进行 一 个 假设 检验 ) 可 能 是 误导 性 的 。 这 些 问题 中 具 兵 哪 一 个 会 出 现 ,以 
及 它 的 补 教 塔 施 是 什么 ,都 依 顿 于 该 非 平 稳 性 的 来 源 。 在 12.6 节 和 12. 7 节 中 ,我 们 研究 了 
在 径 济 时 间 序 列 实证 研究 中 存在 的 两 类 重要 的 非 平稳 性 一 一 趋势 和 突变 一 一 产生 的 原因 和 
解决 的 方法 。 不 过 ,目前 我 们 还 是 简单 地 假设 所 研究 的 序列 是 联合 平稳 的 ,从 而 我 们 集中 研 
究 凌 稳 性 变量 的 回归 问题 ， 
重要 概念 12. 6 

含有 和 多 个 预 潭 因子 的 时 间 序 列 回归 
一 般 的 时 间 序 列 回 归 模型 允许 有 上 上 个 额外 的 预测 因子 ,其 中 包括 第 一 个 预测 因子 的 4 


阶 滞后 ,第 二 个 预测 因子 的 q, 阶 清 后 , 依 此 类 推 。 
Y, A tA Y +&Y, +e +B Yog tŠ X, tiA ua t+ + + 
Š, X. t+ Oak t t Su mog + (12. 20) 


其 中 ， 

L 机 (了 

2. (a) BEHEE (Y, Xo a NO 为 平稳 分 布 ;(b) 随 着 j 值 的 增 大 , (Y, Xa Aa) 
(于 ) 变 成 独立 的 。 

3. X, AM Y, RAIRA RAMANE. 

4. 不 存在 完全 多 重 共 线 性 。 

第 二 个 假设 的 部 分 {(b) 要 求 , 当 分 制 时 间 的 时 期 数 变 得 护 大 时 ,所 研究 的 随机 变量 变 成 
独立 分 布 的 。 这 个 假设 用 时 间 序 列 的 要 求 条 件 一 一 当 观 测 值 被 长 时 期 分 隔 时 它们 是 独立 分 
布 的 一 一 代 奉 了 变量 在 相同 的 观测 值 之 间 是 独立 分 布 的 这 个 截面 性 数据 要 求 的 条 件 。 该 假 
设 有 时 被 称 为 弱 依 存 性 ( weak dependence) , 它 确 保 在 大 样本 条 件 下 ,数据 中 存在 充分 的 
随机 性 使 得 大 数 定律 和 中 心 极限 定理 成 立 。 这 里 我 们 不 给 出 弱 依 赖 性 条 件 精确 的 数学 表 
述 , 感 兴趣 的 读者 可 参考 Hayashi(2000 ,第 2 章 )。 

第 三 个 假设 (与 截面 数据 的 第 三 个 最 小 二 乘 假设 相同 ) 是 ,所 有 变量 具有 非 零 的 有 限 的 
HRE, 

最 后 ,第 四 个 假设 ( 它 也 和 截面 数据 的 假设 相间 ) 是 ,回归 因子 不 是 完全 多 重 共 线 的 。 

统计 推断 和 格 兰 太 因 果 关 系 检 验 。 在 重要 概念 12.6 的 假设 下 ,对 回归 系数 使 用 0LS 
所 做 的 统计 推断 ,按照 使 用 截面 数据 通常 所 采用 的 相同 方法 来 执行 。 

下 统计 量 在 时 间 序 列 预 测 中 的 一 个 很 有 用 的 应 用 是 ,检验 某 一 个 在 方程 中 所 包含 的 回 
归 因 子 的 澡 后 项 是 理 比 模型 中 其 他 的 回归 因子 更 有 预测 意义 。 变 量 没 有 预测 意义 的 主张 ， 
与 这 个 变量 所 有 的 注 后 项 的 系数 都 为 零 的 零 假 设 是 对 应 的 。 检 验 这 个 零 假 设 的 下 统计 量 
被 称 为 格 兰 杰 因果 关系 统计 量 (Granger causality statistic) ,相关 的 检验 被 称 为 格 兰 杰 因果 
关系 检验 (Granger causality test) ( Granger(1969)) 。 这 个 检验 的 内 容 在 重要 概念 12.7 中 


重要 概念 12.7 


格 兰 杰 因果 关系 检验 { 是 否认 预测 意义 的 检验 ) 
格 兰 杰 因果 关系 统计 量 ,就 是 检验 公式 (12. 209) 中 某 一 变量 的 所 有 系数 值 (例如 ,X,.,， 
和 的 系数 ) 都 为 0 的 这 个 零 假 设 的 正统 计量 。 这 个 零 假 设 意味 着 , 这些 回归 因 
子 对 了 没有 预测 意义 ( 包含 在 其 他 回归 因子 中 的 预测 内 容 除 外 ) ,对 这 个 零 假设 的 检验 就 被 


称 为 格 兰 杰 因果 关系 检验 。 

格 兰 杰 因果 关系 与 本 书 中 其 他 部 分 所 提 到 的 因果 关系 几乎 没有 什么 联系 。 在 第 1 章 ， 
因果 关系 是 根据 一 个 理想 的 随机 化 控制 实验 来 定义 的 ,其 中 在 实验 中 使 用 的 不 同 值 , 然 
后 观察 它们 对 Y 的 随后 的 影响 。 相 反 , 格 兰 杰 因 打 关系 意味 着 ,给 定 回归 模型 中 的 其 他 变 
量 , 如 果 工 格 兰 杰 引致 ，, 那么 天 就 是 了 的 一 个 有 用 的 预测 因子 。 尽 管 “ 格 兰 杰 预 测 能 力 ” 
是 一 个 比 “ 格 兰 杰 因果 关系 "更 准确 的 术语 ,但 后 者 已 成 为 经 济 计量 学 专业 术语 的 一 部 分 。 

举例 来 说 ,考虑 通货 膨胀 率 的 变化 与 其 过 去 信和 失业 率 的 过 去 值 之 间 的 关系 。 根 据 公 
式 (12.17) 中 的 OLS 估计 值 ,检验 失业 率 的 四 个 灌 后 项 系数 都 为 0 的 这 个 零 假设 的 下 统计 
起 为 8. 51(p<0.001)。 按 照 重要 概念 12.7 中 的 专业 术语 ,我 们 能 够 得 出 结论 (在 1% 的 显 
FEKET) , 即 该 失业 率 格 兰 杰 引 致 通货 膨胀 率 的 变化 ,但 这 并 不 一 定 意味 着 失业 率 的 变 
化 会 导致 -一 在 第 | 章 的 意义 下 一 一 通货 膨胀 率 的 随后 变化 。 可 是 这 确实 意味 着 ,除了 通 














货 腾 胀 率 的 过 去 值 所 包含 的 有 用 信息 外 ,失业 率 的 过 去 值 看 起 来 包含 了 对 预测 通货 膨胀 率 
变化 有 用 的 信息 。 


12.4.4 预测 的 不 确定 性 和 预 调 的 区 间 


在 任何 入 计 问 题 中 ,报告 估计 值 不 确定 性 的 一 个 测量 指标 是 一 个 很 好 的 习惯 ,预测 也 不 
例外 。 测 量 一 项 预测 不 确定 性 的 一 个 指标 是 均 方 根 预 测 误 差 。 在 误差 项 & 服从 正 态 分 布 
的 这 个 额外 假设 下 ,可 用 RSMFE 构造 一 个 预测 区 间 , 即 以 一 定 的 概率 包含 该 变量 未 来 值 的 
一 个 区 间 。 

EORR GEM 。 预 测 误差 由 两 部 分 组 成 :出 回归 系数 的 估计 所 引起 的 不 确定 性 ,和 与 
u, 的 将 来 未 知 信 有 关 的 不 确定 性 。 对 于 系数 很 少 但 观测 值 很 多 的 回归 而 言 ,由 未 来 的 & 所 
引起 的 不 确定 性 可 能 远大 于 和 和 参数 估计 有 关 的 不 确定 性 。 不 过 ,一 般 地 讲 , 这 两 个 不 确定 性 
的 来 源 都 是 重要 的 ,因此 我 们 现在 为 RMSFE 设计 一 个 把 这 两 个 不 确定 性 的 来 源 都 考虑 进 
来 的 表达 式 。 

为 了 使 符 导 简单 ,考虑 含有 单个 预测 因子 的 一 个 ADL(1,1) 模 型 的 了 ,| 的 预测 问题 , 即 
Y, =B +BY, +B5 和 + 下 ,并 假设 凡是 同方 差 的 ,预测 值 为 名 ,nr =ñ, +A, Y, r, X, PHN 
误差 为 : 

Yra br ur BB) + (ñ -B.)Y, + (Š ~ A (12.21) 

由 于 几 ,: 具 有 条 件 零 均 值 卫 是 同方 差 的 ,因此 ur AEA l , 它 与 公式 (12.21) 中 
最 后 那个 带 括 导 的 表达 式 不 相关 。 所 以 , 均 方 预测 误差 (MSFE) 为 : 

MSFE = E[ (Fpa ~ Ëp) ] (12. 22) 
=g, +var[ (Ê - A) +(É, -i)fr +(Ó, -ô ) Xr] 
而 RMSFE 是 MSFE 的 平方 根 。 

对 MSFE 的 估计 需要 估计 公式 (12. 22) 中 的 两 个 部 分 。 第 一 项 史 可 以 用 该 回归 的 标准 
误 的 平方 来 售 计 , 见 12. 3 节 中 的 讨论 内 容 。 第 二 项 需要 估计 该 回归 系数 的 一 个 加 权 平 均 的 
方差, 估计 的 方法 在 6. 1 节 中 已 论述 过 了 ( 见 公 式 (6.7) 之 后 的 论述 ) 。 

个 计 MSFE 的 男 一 种 可 殿 选 择 的 方法 是 使 用 伪 样 本 外 预测 的 方差 (the variance of 
pseudo out-of-sample forecasts) ,这 是 12. 7 节 中 所 讨论 的 一 种 方法 。 

项 测 的 区 问 。 一 个 预测 区 间 很 像 一 个 置信 区 间 ,只 是 它 是 对 一 项 预测 而 言 的 。 也 就 是 
说 ,一 个 95% 的 预测 区 间 (forecast interval) 是 指 在 扫 %% 的 重复 应 用 中 包含 该 序列 未 来 值 的 
一 个 区 间 。 

预测 区 交 和 置信 区 间 之 间 的 一 个 重要 差异 是 ,通常 一 个 和 5% 的 置信 区 间 的 计算 公式 
《估计 量 +1. 96 人 悦 标准 误 ) 已 由 中 心 极限 定理 所 证 明 , 因 此 它 对 误差 项 的 一 个 更 大 范围 的 分 
布 部 成 立 。 相 反 , 由 于 公式 (12. 21) 中 的 预测 误差 包含 误差 项 wz, 的 未 来 值 , 因 此 为 了 计算 
预测 区 间 ,需要 估计 该 误差 项 的 分 布 或 对 那个 分 布 作 一 些 假设 。 

在 实际 中 ,假设 wr,, 服 从 正 态 分 布 是 很 方 使 的 。 如 果 是 这 样 的 话 , 适 用 于 记 ,B 和 名 的 
公式 (12. 21) 和 中 心 极限 定理 就 意味 着 ,该 预测 误差 是 两 个 独立 的 正 态 分 布 项 的 和 ,因此 ， 
该 预测 误差 本 身 也 服从 方差 为 MSFE 的 正 态 分 布 。 由 此 可 得 ,一 个 站 名 的 署 信 区 间 由 
如 +1., 968E Ypa 一 全 7r) 给 出 ,其 中 ,SEC 一 地 ur 是 RMSFE 的 一 个 估计 量 。 

这 个 讨论 集中 分 析 了 误差 项 wy,, 是 同方 差 的 情形 。 如 果 wi, ,是 异 方差 的 ,那么 就 需要 
开发 出 异 方差 的 模型 ,使 得 给 定 了 和 六 最 近期 的 值 ,能 够 估计 出 公式 (12.22) 中 的 项 。 


对 这 种 象 件 异 方 菇 的 建筑 方法 在 本 3 节 中 讨论 。 

由 于 未 来 事件 的 不 确定 性 , 即 美 于 ur,, 的 不 确定 性 ,95 竺 的 预测 区 间 可 能 术 宽 ,这 样 它 
们 在 决策 中 的 用 人 刻 就 狙 有限, 因此 ,专业 饼 测 人 人 士 汉 常 报告 比 红 名 更 窑 交 于 抽 区 间 , 比 如 说 
一 个 标准 误 的 而 油 区 间 ( 如果 训 莽 项 服从 正 者 和 布 , 那 让 它 就 是 68% BJ NE 51 — Rh 
选 拓 是 ,一 些 预 油 人 士 报告 多 个 巴 讽 区 间 ,就 像 英格兰 惧 行 的 绎 济 学 家 们 在 公布 通货 榜 胀 世 
济 值 时 所 机 的 那样 ( 见 本 章 的 一 般 兴 趣 框 )。 
一 般 兴 起 框 

ñi A 

PE TETE EARR AR p fe Ee A A t — AR A E 8 AL ET eI OB t ME O TRA (ñ. 
EPIRA IE HERIR IT P EIERE MAER EREA RA HA h EE ERR, 1 
Wiru TEREA RAA A ei AA E 
AY RDR II A ESA th 1A E FOUN D (E BEEE a S Ra e a a SA REAA Bi 8 BB llk TT fE: Pi 
的 大 概 范围 。 在 他 们 的 通货 爱 胀 报告 中 ,银行 用 虹 色 于 体 标 示 这 些 范围 ,其 中 诬 红 芭 留 瘦 中 
心 的 范围 绕 。 足 管 让 银行 平 洲 地 称 之 为 " 鹿 形 图” ,但 新 闻 界 却 将 这 些 扩散 的 红色 阴影 叫做 
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am Ewi 
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miu— ñw 

Ë 12—4 HƏR T 2001 年 2 H TI kI h bia 09, 不 是 红色 的 ,因此 震 
要 你 发挥 一 下 想象 力 ) 。 这 个 图 形 , 也 即 2001 年 2 月 份 的 图 形 说 明 , 该 银行 的 经 济 学 家 们 预 
测 下 一 年 的 通 售 朋 了 率 将 从 大 约 3% FRERE 2% ,随后 部会 增加 。 但 这 个 预测 存在 相 
当 夫 的 不 确定 性 。 在 他 们 的 书面 论述 中 ,他 们 特别 引用 了 美国 通货 赔 胀 进一步 下 位 的 可 能 
性 一 事实 上 ,美国 经 济 在 2001 年 是 套 退 的 一 它 会 导致 英 国 通货 岂 屿 率 的 下 降 。 黄 国 的 
通货 鹿 研 率 确实 下 降 了 ,这 说 明 他 们 的 预 调 是 一 个 很 好 的 本 铀 :在 2001 年 的 第 四 季度 ,通货 
Wika 2. 09%. 
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布 了 通货 膨胀 预测 值 。 由 货币 政策 制定 者 所 做 的 决策 是 个 落难 的 决策 ,并 且 影 响 到 许多 社 
会 大 众 的 生活 和 钱包 。 在 一 个 信息 时 代 的 民主 政治 下 ,英格兰 银行 的 经 济 学 家 们 更 加 理性 
化 ,对 公众 而 言 ,理解 银行 的 经 济 展望 报告 和 困难 决策 背后 的 推理 是 特别 重要 的 。 

要 看 到 用 最 初 的 红色 显示 的 血 河 ,请 访问 英格兰 银行 的 网 站 


www. bankofengland. co. uk inflationreport 。 


-12. 5 利用 信息 准则 选择 滞后 长 度 - 


在 12.3 节 和 12.4 节 中 所 估计 的 通货 脱 胀 回归 含有 预测 因子 的 一 阶 或 四 阶 的 灌 后 项 。 
一 阶 汪 后 项 有 一 定 的 意义 ,但 为 什么 四 界 江 后 项 也 有 意义 ? 更 一 般 地 讲 , 在 时 间 序 列 回归 中 
应 包含 多 少 阶 法 后 期 ? 本 节 就 讨论 选择 滞后 阶 数 的 统计 方法 ,首先 我 们 在 自 回归 中 讨论 , 然 
后 在 合 有 多 个 预测 因子 的 时 间 序 列 回归 模型 中 讨论 。 


12.5.1 确定 自 回归 的 阶 数 


在 实际 中 ,选择 一 个 自 辐 归 的 阶 数 p 需要 在 包括 更 多 河 后 项 所 带 来 的 好 处 与 额外 的 居 
计 不 确定 性 的 成 本 之 间 进 行 权衡 。 一 方面 ,如 果 一 个 个 计 的 自 阿 好 的 阶 数 太 低 ,那么 你 就 会 
遗漏 包含 在 更 远 期 滞后 值 中 的 潜在 的 有 价值 的 信息 。 另 一 方面 ,如 果 阶 数 太 高 ,你 又 会 估计 
比 必 要 的 数 是 更 多 的 系数 ,这 又 会 将 额外 的 估计 误差 引信 到 你 的 预测 值 中 。 

下 统计 其 方 法 。 选 择 p 的 一 种 方法 是 ,从 一 个 全 有 多 阶 河 后 项 的 模型 开始 ,并 对 最 后 那 
个 半 后 项 进行 假设 检验 。 合 如 ,你 可 以 从 合计 AR(6) 模 型 开始 ,并 检验 第 六 阶 滞后 项 的 系 
数 在 $ 名 的 水 平 下 是 否 显 著 ;如 果 不 显著 ,就 草 除 它 , 并 个 计 AR(5) 模 型 ,检验 第 五 阶 滞后 项 
系数 , 依 此 类 推 。 这 个 方法 的 缺点 是 它 会 生成 一 个 过 天 的 模型 ,至 少 有 时 候 会 ;如 果真 正 的 
AR 阶 数 是 5 ,那么 第 六 阶 的 系数 就 是 0, 使 用 统计 量 的 一 个 5 多 水 平 的 检验 只 有 5 各 的 偶 
然 机 会 会 不 正确 地 拒绝 这 个 零 假设 。 因 此 , 当 的 真实 值 为 5 时 ,这 种 方法 会 有 5 够 的 机 率 
将 估计 为 6。 

BIC 谁 则 。 围 绕 这 个 问题 的 一 种 方法 是 用 最 小 化 “信息 准则 "来 估计 p。 这 种 信息 准则 
之 一 就 是 由 叶 斯 信息 准则 (Bayes information criterion ,简写 为 BIC) ,也 被 称 为 许 瓦 兹 信息 
准则 { Schwarz information criterion, 简写 为 SIC) , 它 的 公式 是 : 

BIC(p) =In[ SEU] + (pa (12.23) 


其 中 ,SSR(P) 是 所 估计 的 AR(p) 的 残 差 平方 和 。P 的 BIC 估计 量 p 是 在 可 能 选择 的 p=0， 
1… ,pw 范围 内 使 BIC{p) 最 小 的 那个 值 ,其 中 ps 是 所 考虑 的 P 中 最 大 的 那个 值 。 

BIC 公式 怎 看 起来 可 能 有 一 点 神秘 ,但 它 具 有 直观 的 吸引 力 。 考 虑 会 式 (12. 23) 中 的 第 
一 项 ,由 于 回归 系数 是 用 OLS 估计 的 ,因此 当 增 加 滞后 项 时 , 残 差 平方 和 必然 会 减少 (或 至 
少 不 会 增加 ) 。 相 反 , 第 二 项 是 所 估计 的 回归 系数 的 个 数 {滞后 阶 数 p 吉 上 裁 距 项 DAEA 
子 (lnT)/T。 当 增加 河 后 项 时 ,第 二 项 会 增 大 。BIC 要 平衡 这 两 个 影响 力量 ,使 得 最 小 化 
BIC 的 河 后 阶 数 是 真实 滞后 长 度 的 一 个 一 致 估计 量 。 这 个 论述 的 数学 证 明 在 附录 12 5 中 
给 出 。 

必 为 一 个 例子 ,考虑 估计 通货 膨 跃 率 变 化 的 AR 的 阶 数 。 对 于 最 大 阶 数 为 6(p。 =6) 
的 自 铝 归 而 言 ,BIC 的 不 同 计算 步骤 在 表 12 一 3 中 完成 。 例 如 ,对 公式 (12.7) 中 的 AR(1) 
模型 而 言 ,SSR(1)/AT=2.726, 因 此 In[ SSRC1)/T] =1. 003, HF T=152(38 年 ,每 年 4 个 
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计 和 额外 系数 的 成 本 之 间 进 行 权衡 。 

丘 统 计 旺 方法 。 和 在 单 变量 自 回 好 中 一 样 ,确定 要 包括 的 滞后 阶 数 的 一 种 方法 就 是 用 
到 统计 基 检 验 系数 集 都 等 于 零 的 联合 假设 。 例 如 , 在 公式 (12. 17) 的 讨论 中 ,我 们 检验 了 失 
业 率 的 第 二 阶 到 第 四 阶 滞后 项 的 系数 都 等 于 零 的 这 个 零 假 设 , 备 择 假设 是 它们 都 不 为 零 。 
这 个 假设 在 1 和 的 显著 性 水 平 下 被 拒绝 ,这 为 较 长 的 滞后 设 定 握 供 了 支持 。 如 果 所 比较 的 
模型 数量 较 少 ,那么 这 个 下 统计 量 方法 易于 使 用 。 然 而 一 般 来 说 ,天 统计 量 方法 会 生成 过 大 
的 模型 ,从 这 个 意义 上 说 ,真实 的 湛 后 阶 数 被 高 人 了 。 

说 及 准则 。 和 自 回归 一 样 ,BIC 和 AIC 也 可 用 于 估计 含有 多 个 预测 因子 的 时 间 序 列 模 
型 中 湛 后 项 和 变量 的 个 数 。 如 果 回 归 模 型 中 有 有 天 个 系数 (包括 截 距 ) ,那么 BIC 为 ; 

BIC(K) =In[ S(t) aKT (12.25) 


AIC 可 以 同样 的 方式 定义 ,但 用 2 代替 公式 (12.25) 中 的 In(7T)。 对 每 个 所 要 评价 的 模型 ， 
可 以 求 出 BIC( 或 AIC) 的 值 ,根据 信息 准则 ,具有 BIC( 或 AIC) 最 小 值 的 模型 便 是 我 们 所 要 
选择 的 模型 。 I 
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一 样 ,所 有 候选 模型 必须 用 相同 的 样本 进行 佑 计 ; 用 公式 (12.25) 的 符号 ,用 于 估计 模型 的 
观测 期 数 了 对 所 有 模型 必须 相同 。 第 二 , 当 存 在 多 个 预测 因子 时 ,由 于 需 昌 计算 许多 不 同 
的 模型 (许多 汪 后 参数 的 组 合 ) ,因此 在 计算 上 这 种 方法 的 工作 量 很 大 。 在 实践 中 ,一 个 捷 
径 就 是 要 求 所 有 回归 因子 具有 相同 的 滞后 阶 数 , 即 划 求 =9 =… g RE, RA Daa tl 
个 模型 需要 比较 (对 应 于 p=0,1,… Pun) o 




















[12.6 _ 非 平稳 性 了 :趋势 ] 


在 重要 概念 12. 6 中 ,假设 因 变量 和 回归 因子 都 是 平稳 的 。 如 果 事 实 并 非 如 此 ,也 就 是 
说 ,如 果 因 变量 和 /或 回归 因子 是 不 平稳 的 ,那么 常规 的 假设 检验 ,置信 区 间 和 预测 则 可 能 是 
不 可 靠 的 。 由 非 平稳 性 所 引起 的 准确 性 问题 及 其 解决 这 个 问题 的 方法 ,依赖 于 该 非 平稳 性 
的 性 质 。 

在 这 一 节 和 下 一 节 里 ,我 们 研究 经 济 时 间 序 列 数 据 中 两 类 重要 的 非 平稳 性 :趋势 和 突 
变 。 在 每 一 节 里 ,我 们 首先 介绍 非 平稳 性 的 性 质 , 然 后 讨论 如 果 这 类 非 平 稳 件 存在 却 被 名 略 
的 情况 下 对 时 间 序 列 回归 所 产生 的 后 果 。 接 下 来 我 们 提出 非 平稳 性 的 检验 ,讨论 由 那个 特 
殊 类 型 的 非 平 稳 性 所 引起 的 问题 的 补救 措施 或 解决 方法 。 我 们 从 讨论 趋势 开始 。 


12. 6.1 什么 是 趋势 ? 

趋势 (trend) 是 指 某 一 变量 随时 间 变 化 所 产生 的 持续 的 长 期 的 运动 。 某 一 时 间 序 列 变 
量 围绕 着 它 的 趋势 波动 。 

检查 图 12 一 1(a) 我 们 发 现 ,美国 通货 网 胀 率 包含 从 开始 到 1982 年 的 一 个 总 体 上 升 趋 
势 和 之 后 的 一 个 总 体 下 降 和 趋势。 图 12 一 2(a) ,12 一 2(b) 和 12 一 2(c) 中 的 序列 也 有 趋势 ,但 
它们 的 趋势 大 不 相同 。 美 国联 邦 基金 利率 的 趋势 类 似 于 美国 通货 膨胀 率 的 趋势 。 在 1972 
年 固定 汇率 体系 崩溃 以 后 , 美元 /英镑 汇率 明显 具有 一 个 延长 的 下 降 趋势 。 日 本 实际 CDP 
的 对 数 的 趋势 较为 复杂 :起 初 快速 增长 ,而 后 适度 增长 ,最 后 缓慢 增长 。 








PEIS AWLP 手势。 在 时 间 序 列 数据 中 存在 两 类 可 见 到 的 趋势 , 即 确定 性 趋势 
和 随机 性 趋势 。 确 定性 趋势 (deterministic trend) 是 时 间 的 一 个 非 随机 函数 。 例 如 ,一 
定性 趋势 可 能 是 时 间 的 线性 函数 。 如 果 通 货 膨 胆 拥有 一 个 确定 性 的 线性 趋势 ,使 得 它 每 个 
季度 增加 .1 个 百分点 ,那么 这 个 趋势 可 以 记 作 上 0. 11, 其 中 :为 季度 测量 。 相 反 , 一 个 随机 
性 趋势 ( stochastic trend) 是 随机 的 ,而 且 随 时 间 的 变化 而 变化 。 例 如 ,通货 脱 王 中 的 一 个 
随机 趋势 可 能 先 表 更 出 一 个 延长 期 的 上 升 ,随后 表现 出 一 个 延长 期 的 下 降 ,就 像 图 12 一 上 中 
的 通货 膨胀 趋势 一 样 。 

和 许多 经 济 计量 学 察 一 样 ,我 们 认为 将 经 济 时 间 序 列 建立 为 含有 随机 性 趋势 而 不 是 确 
定性 趋势 的 模型 更 合适 。 经 济 学 是 个 很 复杂 的 事物 ,很 难 使 一 个 确定 性 趋势 所 隐 全 的 预测 
结果 与 工人 .商业 和 政府 所 面 对 的 年 复 一 年 的 复杂 因素 与 意外 事件 相 一 致 。 例 如 ,发 管 美国 
AAE HAER 20 记 纪 70 年代, 但 这 既 不 会 注定 永远 地 上 涨 ,也 不 会 注定 又 一 次 地 下 
降 。 热 而 ,通货 膨胀 的 缓慢 上 涨 现在 可 被 理解 为 由 于 坏 运 气 和 不 良 的 货币 政策 而 发 生 的 , 绥 
慢 上 涨 大 部 分 归 因 于 联邦 储备 管理 委员 会 的 强 春 决策 的 结果 。 同 样 ,从 1972 年 到 1985 年 ， 
美元 /英镑 汇率 趋势 向 下 ,随后 向 上 漂移 ,但 这 些 运 动 也 是 复杂 经 济 力量 作用 的 结果 。 由 于 
这 些 力量 的 变化 不 可 预测 ,因此 这 些 趋 势 被 看 做 是 含有 大 量 的 不 可 预测 或 随机 的 成 分 ,这 是 
很 有 意义 的 。 

由 于 这 些 原因 ,我 们 对 经 济 时 间 序 列 中 的 趋势 的 处 理 集中 在 随机 性 趋势 上 ,而 不 是 集中 
在 确定 性 趋势 上 上。 在 时 间 序 列 数据 中 , 当 我 们 提 到 ”趋势 "时 ,我 们 是 指 随机 性 趋势 ,除非 我 
们 特别 说 明 。 这 一 节 给 出 最 简单 的 随机 趋势 模型 , 即 随机 游 动 模型 ,其 他 的 趋势 模型 在 
14.3 节 中 讨论 。 

临 执 的 随机 游 动 模 卉 。 含有 随机 趋势 的 一 个 变量 最 简单 的 模型 是 随机 游 动 模型 。 如 果 
某 一 时 间 序 列 了 的 变化 是 独立 同 分 布 的 ,也 就 是 说 ,如 果 ; 

Y =Y... +u, (12.26) 
那么 就 称 服从 随机 游 动 { random walk) ,其 中 , 是 独立 间 分 布 的 。 不 过 ,一 般 情况 下 ， 
我 们 将 使 用 术语 ” 来 指 那些 满足 公式 (12. 26) 的 时 间 序 列 ,这 里 u, 具有 条 件 零 均 
值 , 即 有 (ui 于， …) =0。 

m amana ee. 一 个 序列 的 明天 值 ,等 于 它 的 今天 值 加 上 一 个 不 可 预测 的 变 
dE. H -T Y, 所 遵循 的 路 径 由 随机 的 " 步 "u 组 成 ,因此 那 条 路 径 就 是 “随机 游 动 ”。 根 据 从 


开始 到 上- 1 时 刻 的 数据 ,了 , Bhai Yo EREN, AA El Y, Y, 0 ,所 
以 E(Y,IY,. 13 Y,- -1 =)= Y,- l° 换 人 句 话 说， 如 果 Y, 服从 随机 游 动 ， 那么 明天 值 的 最 优 巴 测 是 
它 的 今天 值 。 


一 些 序列 ,如 图 12 一 2(c) 中 日 本 GDP 的 对 数 , 具 有 明显 的 上 升 趋势 ,在 这 种 情况 下 ,对 
该 序列 的 最 优 预测 必须 包含 对 该 序列 上 升 趋势 的 一 个 调整 。 这 种 调整 使 随机 游 动 模型 扩展 
为 包括 向 一 个 方向 运动 成 者 向 男 一 个 方向 运动 的 趋势 运动 项 或 漂移 项 ” ,这 个 扩展 形式 被 


称 为 带 漂移 项 的 舱 机 游 动 {random walk with drift) 。 
Y, =o +Y, +n, (12.27) 


JReh,E(u IY, V...) =0,8 为 随机 游 动 的 "漂移 项 ” 。 如 果 Bs 是 正 的 ,那么 平均 来 说 
Y, 会 增加 。 AROTAN BIED, 对 序列 明天 和 值 的 最 优 预 测 ,是 今天 的 序列 值 加 
ERM Bao 


随机 游 动 模型 (适当 时 带 漂移 项 ) 至 今 仍 是 简单 通用 的 ,并 且 是 本 书 中 所 使 用 的 测定 趋 
势 的 主要 模型 。 








7 AO 











随机 游 动 是 非 平 稳 的 。 如 果 节 服从 随机 游 动 ,那么 它 就 不 是 平稳 的 。 一 项 随机 游 动 的 
方差 随时 间 而 增加 ,因此 ,Y, 的 分 布 随时 间 而 变化 。 理 解 这 一 点 的 一 种 方法 就 是 认识 到 ,在 
公式 (12. 26) 中 ,由 于 ww 序列 无 关 , 因 此 vart Y) = var( 了 1) +var(u,); Bi T Y, 是 平稳 的 ， 
var( 于) 不 可 能 依赖 于 时 间 ,因此 ,var( 了 ) = var( 了 1) 必然 成 立 ,但 这 只 有 在 Yart 4,) =0 时 
才 会 发 生 。 理 解 这 一 点 的 另 一 种 方法 是 假想 了 从 0 开始, 即 Y. =0, 那 么 =,Y =m + 
aa, 依 此 类 推 , 这 样 Y. =u, fu +… +wo 由 于 序列 无 关 , 因 此 ,var( Y.) =var(u, tu, tee 
+u) =to0s。 因 而 ,Y, 的 方差 依赖 于 1, 事 实 上 , 它 随 着 1 的 增加 而 增加 。 由 于 了 的 方差 依赖 
于 1, 因 此 它 的 分 布依 赖 于 1. 即 它 是 非 平 稳 的 。 

因为 随机 游 动 的 方差 逃 限 地 增加 ,所 以 它 的 总 体 自 相关 没有 定义 (一 阶 自 协 方 差 和 方 
差 有 是 无 限 的 ,二 者 的 比值 没有 意义 )。 不 过 ,随机 游 动 的 一 个 特征 就 是 它 的 样本 自 相 关系 数 
倾向 于 非常 通 近 于 1 ,事实 上 ,随机 游 动 的 7 阶 样本 自 相 关系 数 依 概率 收 合 于 1。 

随机 趋 反 . 自 回归 模型 和 单位 根 。 随 机 游 动 模型 是 AR(1) 模 型 (公式 (12.8)) 的 一 个 
FALAR g =1。 换 外 话说 ,如 果 了 满足 B=1 的 AR(1), 那 么 了 包含 一 个 随机 趋势 ,并 
且 是 非 伴 稳 的 。 然 而 ,如 果 1B1<1, 有 uw, 是 平稳 的 ,那么 了 和 它 的 灌 后 项 的 联合 分 布 不 依 
HT ARERR 12. 2 中 给 出 )。 因 此 只 要 u 是 平稳 的 ,也 就 是 平稳 的 。 

AR(P) 平 稳 的 类 似 条 件 比 AR(1) 的 条 件 18,1 <1 更 复杂 。 它 的 正式 陈述 涉及 多 项 式 1 
-Bz -Bz -Br -…-B2 的 根 (这 个 多 项 式 的 根 就 是 方程 1 -Bs B, -Bo … - B Z 
=0 的 解 )}。 对 于 一 个 平稳 的 AR{p) ,这 个 多 项 式 的 根 的 绝对 值 必定 都 大 于 1。 在 AR(1) 的 
特殊 情况 下 , 根 是 解 ] -Biz=0 所 得 到 的 : 的 值 , 故 它 的 根 是 z=17B,。 因 而 , 根 的 绝对 值 大 
于 1 的 命题 等 价 于 1B,1<TI。 

如 果 AR(p) 有 个 等 于 1 的 根 , 则 称 该 序列 有 单位 自 回归 根 (unit autoregressive root) ， 
或 更 简单 地 称 为 单位 根 ( unit root) WMR 了 有 单位 根 ,那么 它 就 估 售 随机 性 趋势 。 如 果 北 
是 平稳 的 (因而 设 有 单位 根 ) , 它 就 不 包含 随机 性 趋势 。 由 于 这 个 原因 ,我 们 会 挛 赫 使 用 术 
TR“ 随机 趋势 "和 ”单位 根 ”。 


12.6.2 随机 性 趋势 所 引致 的 问题 


如 果 一 个 回归 因子 含有 随机 性 趋势 (含有 单位 根 ) ,那么 即使 在 大 样本 条 件 下 ERR 
数 的 OLS 估计 量 及 其 OLS: 统计 量 可 能 会 有 非 标准 的 ( 即 非 正 态 的 ) 分 布 。 我 们 讨论 这 个 问 
题 的 三 个 具体 的 方面 :第 一 ,如 果 自 回归 系数 的 真实 值 是 1 那么 AR(1) 中 它 的 佑 计量 偏 向 
于 0; 第 二 ,即使 在 大 样本 条 件 下 ,具有 随机 性 趋势 的 回归 因子 的 ; 统计 量 可 能 服从 非 正 态 分 
布 ;第 三 ,由 随机 性 趋势 所 引致 的 风险 中 ,一 个 极端 例子 就 是 ,两 个 独立 的 序列 如 果 都 有 随机 
性 趋势 的 话 ,它们 会 以 很 高 的 概率 使 人 误 认 为 是 相关 的 ,这 种 情况 被 称 作 乙 回归 。 

问题 1: 偏 向 于 0 的 白 回 归 系 数 。 假 设 Y 服从 公式 (12. 26) 中 的 随机 游 动 ,但 这 对 经 济 
计量 学 家 是 未 知 的 ,他 们 反面 估计 公式 (12,8) 中 的 AR(t1) 模 型 。 由 于 是 非 平稳 的 ,重要 
概念 12.6 中 时 间 序 列 回 归 的 最 小 二 乘 假设 不 成 立 , 因 而 ,作为 一 个 一 般 的 情况 ,我们 不 能 依 
靠 通常 服从 大 样本 正 态 分 布 的 估计 量 和 检验 统计 量 。 守 实 上 ,在 这 个 例子 中 ,自问 归 系数 的 
OLS 佑 计量 成 是 一 致 的 ,但 它 服从 非 正 态 分 布 , 即 使 在 大 祥 本 条 件 下 也 是 如 此 ,局 的 渐 近 分 
布 偏向 于 0。 À, 的 期 户 值 约 为 E(B)=1 -5.3/T。 对 一 般 经 济 应 用 中 的 样本 容量 来 说 ,这 
会 导致 大 的 偏差 。 例 如 ,20 年 的 季度 数据 包含 80 个 观察 值 ,在 此 情况 下 ,名 HAREE 
BB) =1 一 5.3780 =0.934。 此 外 ,这 个 分 布 有 很 长 的 左 尾 。 训 的 5 名 百 分 位 数 级 为 1 - 


14. 177, 对 了 =80 而 言 ,相应 地 得 到 0.824 ,因此 有 5% 的 机 会 包 <0 824。 

这 个 偏向 于 0 的 偏差 的 “个 含义 是 :如 果 Y, 服从 随机 游 动 ,那么 基于 AR(1) 模 型 所 得 
出 的 预测 ,可 能 比 基 于 将 真实 值 设 定 为 记 = 1 的 随机 游 动 模型 所 做 出 的 预测 ,结果 会 更 糟 
糕 。 这 个 结论 也 适用 于 更 高 阶 的 自 回归 情形 ,在 那里 当 序 列 确实 含有 单位 根 时 ,强加 一 个 单 
位 根 (也 就 是 说 ,用 … 阶 差分 代替 水 平 值 居 计 自 回归 ) 对 预测 有 好 处 。 

问题 2:! 统计 量 的 非 止 念 分 布 。 如 果 一 个 回 妇 因子 有 随机 趋势 ,那么 通常 的 OLSi 统计 
其 在 零 假设 下 服从 非 正 态 分 布 ,即使 在 大 样本 情况 下 也 是 如 此 。 这 个 非 正 态 分 布 意味 着 , 常 
规 的 置信 区 间 不 是 有 将 的 ,而 且 不 能 像 往 常 那样 进行 假设 检验 。 一 般 地 说 ,这 个 :统计 量 的 
分 布 不 容易 列表 显示 ,因为 该 分 布依 赖 于 我 们 所 研究 的 那个 回归 因子 和 其 他 回归 因子 之 问 
的 关系 。 可 能 列表 显示 这 个 分 布 的 一 个 重要 情形 是 在 含有 单位 根 的 自 回归 的 情况 下 , 当 我 
们 开始 检验 时 间 序 列 是 否 含有 随机 趋势 时 ,我 们 还 会 回 到 这 个 特殊 情况 中 。 

问题 3: 伪 回归 。 随 机 性 趋势 会 使 两 个 不 相关 的 时 间 序 列 看 上 去 相关 ,这 个 问题 被 称 为 
以 回 妇 ( spurious regression), 

例如 ,从 20 世纪 60 年 代 中 期 到 80 年 代 初 期 ,美国 通货 膨胀 逐步 上 升 ,同时 日 本 GDP 
也 逐步 上 升 。 使 用 常规 的 测量 ,这 两 个 趋势 凌 合 起 来 生成 一 个 看 上 去 是 “显著 的 "回归 。 使 
用 OLS 利用 从 1965 年 到 1981 年 的 数据 进行 估计 ,这 个 估计 的 回归 是 : 


— 一 
U. 5. Inflation, = -2.84 + 0.18 JapaneseGDP,,R =0.56 (12.28) 
(0.08) (0.02) 


斜率 系数 的 ;统计 晤 超过 9, 根 据 我 们 常用 的 标准 ,这 表明 两 个 序列 之 间 有 强 正 向 关系 ， 
且 尼 也 较 高 。 但 使 用 从 1982 年 到 1999 年 的 数据 进行 同样 的 回归 ,我 们 得 到 : 


—— — _— 
U. S. Inflation, = 6,25 - 0.03 JapaneseGDP,,R' =0. 07 (12.29) 
(1.37) (0.01) 


公式 (12. 28) 和 公式 (12. 29) 中 的 回归 简直 太 不 相同 了 。 按 照 字 面 解释 ,方程 (12. 28) 
显示 了 强 正 向 关系 ,而 公式 (12. 29) 显 示 了 弱 负 向 关系 。 

这 两 个 矛 届 结 果 的 根源 就 是 这 两 个 序列 都 有 随机 性 趋势 。 这 些 趋势 恰巧 从 1965 年 到 
1981 年 是 一 致 的 ,但 从 1982 年 到 1999 年 却 不 一 致 了 。 实 际 上 ,在 经 济 方面 或 政治 方面 都 
不 存在 有 说 服 力 的 理由 认为 这 两 个 序列 中 的 趋势 是 相关 的 。 简 而 言 之 ,这 些 回归 是 虚假 
(CR EA. 

公式 {12. 28) 和 公式 (12. 29) 中 的 回归 在 实证 土 说 明了 这 样 的 理论 观点 ; 当 序 列 包 含 随 
机 性 趋势 时 ,0LS 估计 量 可 能 会 产生 误导 ( 见 练习 12.6 的 计算 机 模拟 , 它 证 明了 这 个 结 
论 )。 一 种 特殊 情况 是 当 两 个 序列 的 趋势 成 分 相同 的 时 候 , 即 当 序 列 包含 祖 同 的 随机 人 性 趋 
势 的 时 候 , 某 些 以 回 妇 为 基础 的 方法 是 可 靠 的 。 如 果 是 这 样 的 话 ,那么 就 说 该 序列 是 协 整 
的 。 识 别 和 分 析 协 整 经 济 时 间 序 列 的 方法 在 14.4 节 中 讨论 。 


12.6.3 随机 趋势 的 识别 :单位 AR 根 检验 


时 间 序 列 数据 中 的 趋势 可 以 用 正式 的 和 非 正 式 的 方法 来 识别 。 非 正式 方法 包括 审视 时 
间 序 列 的 数据 图 和 计算 自 相关 系数 .就 像 我 们 在 12.2 节 中 所 做 的 那样 。 因 为 如 果 序 列 有 随 
机 性 趋势 ,那么 一 阶 自 相 关系 数 会 接近 于 1 ,至 少 在 大 样本 情况 下 是 如 此 ,所 以 ,一 个 小 的 一 
阶 自 相关 系数 和 一 个 没有 明显 趋势 的 时 间 序 列 图 结合 在 一 起 表明 了 该 序列 确实 没有 趋势 。 
然而 ,如 果 还 存在 疑问 ,那么 还 有 正式 的 统计 方法 用 来 检验 序列 中 存在 随机 性 趋势 这 一 零 候 
设 对 应 于 序列 中 不 存在 随机 人 性 趋势 这 一 备 择 假 设 。 
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在 本 节 中 ,我 们 用 迪 基 一 富 勤 检验 { 以 其 创始 人 David Dickey 和 Wayne Fuller( 1979) 的 
名 字 合 名) 检验 随机 性 移 势 尽管 过 基 一 富 勒 检验 不 是 随机 人 性 趋势 的 惟一 检验 方法 5 另 一 
个 检验 在 14.3 节 中 讨论 ) ,但 它 是 实际 中 最 常用 的 检验 ,并 且 是 最 可 靠 的 检验 之 一 。 

RDD 模 击 让 的 过 基 一 宵 半 检验 。 迪 基 一 富 勒 检验 { Dickey-Fuller test) 的 出 发 点 是 自 
回归 模型 。 恕 前面 所 讨论 的 ,公式 (12,27) 中 的 随机 游 动 是 B, =1 的 AR(1) 模 型 的 一 个 特 
Ple WRA =1, 那 么 是 非 平稳 的 且 含 有 一 个 (随机 ) 趋势 。 因 而 ,在 AR(1) 模 型 内 ,了 S 
有 随机 性 趋势 的 假设 可 以 通过 检验 以 下 的 假设 进行 检验 。 

E F =ñ, +B Y... +u E H. lA <1 (12.30) 

如 果 有 =1 ,那么 AR{I) 有 值 为 1 的 自 回归 根 ,因此 ,公式 (12. 30) 中 的 零 假设 是 AR(1) 
有 单位 根 , 备 择 假 设 是 它 是 平稳 的 。 

通过 将 公式 (12. 30) 两 边 都 威 去 了 ,所 得 到 的 修正 的 模型 ,对 这 个 模型 执行 检验 最 容 
Be Tåg 一 1 ,那么 公式 (12.30) 变 为 ; 

在 AY = 房 +6 +u, H, H, :8=0,H 8 <0 (12.31) 

在 公式 (12. 31) 中 ,检验 85=0 的 OLS 统计 量 被 称 为 迪 基 一 富 勒 统计 量 { Dickey-Fuller 
statistic) 。 公 式 (12. 31) 中 的 表达 式 是 简便 的 ,因为 回归 软件 会 自动 给 出 检验 5=0 的 上 统 
计量 。 注 意 , 迪 基 一 富 勒 检验 是 单 边 的 ,因为 相关 的 各 择 假 设 为 7, 是 平稳 的 ,所 以 有 BB, <1, 
或 者 5<0 。 用 “ 非 稳健 的 "标准 误 , 邑 附录 4.4 中 所 介绍 的 “ 仅 适 用 于 同方 差 " 的 标准 误 ( 公 
式 {4.62) 中 单个 回归 因子 情形 和 16.4 节 中 多 元 回归 模型 的 情形 ) 计算 迪 基 -- 富 勒 统 
HET, 

AR(DO 模 并 中 的 迪 上 其 一 信和 勒 检验 。 在 公式 (12. 31) HETA Ma 3 5tH- 
量 只 适用 于 AR(1) 模 型 。 如 12. 3 节 中 所 讨论 的 ,对 一 些 序列 而 言 ,AR(1) 模 型 没有 捕捉 到 
Y, 中 所 有 的 序列 相关 ,在 此 情况 下 ,选择 一 个 较 高 阶 的 自 回 归 会 更 合适 。 

AR(p) 模 型 的 亿 基 一 富 勒 检验 的 扩展 形式 在 重要 概念 12.8 中 总 结 。 在 零 假 设 下 ,5 = 
,AY, EFR AR). 在 备 择 假 设 下 ,8 <0, 因 此 了 是 平稳 的 。 因 为 用 于 计算 该 迪 基 一 
语 勤 统计 量 的 这 种 形式 的 回归 被 AY, 的 滞后 项 扩大 了 ,所 以 相应 的 :统计 量 又 被 称 为 增 项 
的 迪 基 一 富 勒 1ADF) 统 计量 (augmented Dickey-Fuher{ ADF ) statistic) 。 

一 般 地 说 , 兴 后 长 度 p 是 未 知 的 ,但 可 以 使 用 应 用 于 不 同 P 值 的 公式 (12. 32) 的 回归 的 
信息 准则 来 估计 它 。 对 AD 统计 量 的 研究 表明 ,含有 太 多 的 灌 后 项 比 含有 太 少 的 滞后 项 要 
好 ,因此 对 ADF 统计 量 而 言 ,建议 用 AIC 代替 BIC 来 估计 po@ 


重要 概念 12. 8 











单位 自 回 蚊 根 的 增 项 的 迪 基 一 富 鞠 检验 
单位 自 回 归根 的 增 项 的 迪 基 一 富 勒 检验 ,是 检验 回归 方程 (12. 32) 中 零 恨 设 囊 :5=0 
和 对 应 的 单 边 备 择 假 设 所:5 <0。 
AY, =B, +6Y,_, +y AY +AA, + AY tu, . {12. 32) 
在 该 零 假设 下 ,Y, 有 随机 性 趋势 ;在 备 择 假设 下 ,了 是 平稳 的 。 这 里 的 ADF 统计 量 就 是 
检验 公式 (12. 32) 中 58=0 的 OLS: 统计 量 。 
相反 ,如 果 备 择 假设 是 “Y, 围绕 确定 性 的 线性 时 间 趋 势 是 平稳 的 ” ,那么 ,这 个 趋势 “ 


a RERET RB Ye 09" EER MERSER TERERAA AER: 统计 和 量 , 一 个 令 人 惊讶 而 又 特 
多 “请 参考 Seck( 1994) 关 于 巡 基 一 富 蔓 和 其 他 单位 根 栓 验 统计 量 有 限 样本 性 质 的 相关 模 报 研究 综述 。 


了 
An = 0.53 - O1 hfa- O14 Ag. - 0.25 AR s+ 0.24 Anf OOL Ana (12.34) 
(0.235 aa (0) T 0R) H (0.08) ks: (0.08) “i 


这 里 的 ADF: 统计 量 就 是 检验 假设 M, RAA O 的 :统计 和 量 , 这 里 1= -2. 60, RER 
1 一 4,5 铝 的 临界 值 为 -2.86。 因 为 ADF: 统计 量 -2.60 比 -2.86 大 ,所 以 该 检验 在 5 名 的 
显著 性 水 平 下 不 能 被 拒绝 。 因 此 ,根据 公式 (12. 34) 中 的 回归 ,我 们 (在 5 名 的 水 平 下 ) 在 通 
货 膨 胀 是 平稳 的 备 择 假 设 下 不 能 拒绝 通货 膨胀 有 单位 根 的 零 假设 ,也 就 是 说 ,通货 膨胀 包含 
随机 性 趋势 ,对 应 的 备 择 假设 是 该 序列 是 平稳 的 。 

公式 (12. 34) 中 的 ADF MHART Aby, 的 四 阶 半 后 项 来 计算 ADF 统计 量 。 当 用 AC 
估计 沾 后 阶 数 时 ,其 中 0<p<6, 汪 后 长 度 的 AKC 司 计 量 却 是 3。 当 使 用 三 阶 滞后 时 ( 即 当 
aa- 和 as 作为 回归 因子 被 包括 进来 时 ) ,ADF 统计 晤 为 -2.65, 它 比 -2.86 
大 ,因而 , 当 ADF 回归 中 的 带 后 阶 数 用 AC 选择 时 ,通货 膨胀 全 有 随机 性 趋势 的 假设 在 5 名 
的 显著 性 水 平 下 不 能 被 拒绝 。 

这 些 检验 是 在 5% 的 显著 性 水 平 下 执行 的 。 不 过 ,在 10% 的 显著 性 水 平 下 该 检验 也 拒 
绝 了 单位 根 的 零 假设 : -2. 60{ 四 阶 滞 后 ) 与 -2. 邱 ( 三 阶 滞后 ) 的 ADF 统计 量 比 -2.57 的 
10% 临界 值 稍微 小 一 点 。 因 此 ,ADF 统计 量 做 了 一 个 意思 相当 食 燃 的 描述 , 预测 者 必须 以 
一 个 可 靠 的 信息 为 基础 做 出 判断 ,是 否 将 通货 膨胀 建立 为 一 个 含有 随机 性 趋势 的 模型 。 显 
然 ,图 12 一 1{a) 中 的 通货 膨胀 表现 出 长 期 摆动 ,与 随机 性 趋势 模型 一 致 。 此 外 ,在 实际 中 ， 
许多 预测 老 把 美国 通货 膨胀 看 做 为 含有 隧 机 性 趋势 ,这 里 我 们 遵循 这 种 策略 。 


12.6.4 ”避免 由 随机 性 趋势 所 引致 的 问题 


处 理 一 个 序列 中 的 趋势 的 最 可 靠 的 方法 ,就 是 对 该 序列 进行 变换 ,使 得 它 不 含有 趋势 。 
如 果 序 询 含 有 趋势 , 即 序列 有 单位 根 ,那么 该 序列 的 一 阶 差分 就 没有 趋势 。 例 如 , 如果 HB 
从 随机 游 动 , 则 有 了 =8, +Y, +u, BREZ AY, =B +u, 是 平稳 的 。 因 此 ,使 用 一 阶 差分 就 制 
除了 序列 中 的 随机 游 动 趋势 。 

实际 上 ,你 很 少 能 够 确定 一 个 序列 中 是 否 含有 随机 社 涧 势 。 作 为 一 个 一 般 的 观点 ,回想 
一 下 ,无 法 拒绝 零 假设 并 不 一 定 意味 著 这 个 零 假 设 是 真 的 ,确切 地 说 , 它 仅 仪 意味 着 你 没有 
充分 的 证 据 得 出 它 是 假 的 结论 。 因 此 ,用 ADF 统计 量 无 法 拒绝 存在 单位 根 的 零 假 设 并 不 意 
味 着 该 序列 确实 有 单位 根 。 例 如 ,在 一 个 AR(1) 模 型 中 ,真实 的 系数 8, 可 能 非常 逼近 于 1， 
比如 说 0. 98 ,在 此 情况 下 ADF 检验 具有 很 低 的 效力 ,也 就 是 说 ,就 我 们 的 通货 膨胀 序列 的 样 
本 规模 ,正确 地 拒绝 该 零 假设 的 概率 很 低 。 即 使 无 法 拒绝 存在 单位 根 的 零 假设 ,也 并 不 意味 
着 序列 有 单位 根 ,真实 的 自 回 归根 近似 等 于 1 仍然 是 合理 的 ,因此 应 该 使 用 序列 的 差分 而 非 
水 平 值 0?。 . 


[12.7_ 非 平稳 性 了 ;突变 ] 


当 总 体 回 归 函 数 在 样本 期 间 发 生变 化 时 , 便 出 现 了 第 二 类 非 平稳 性 。 在 经 济 学 中 ,发 生 
这 种 情况 的 原因 可 能 是 多 样 的 ,比如 经 济 政 策 的 改变 ,经 济 结构 的 变化 ,或 改变 某 一 具体 行 
业 的 一 项 发 明 等 。 如 果 这 样 的 变化 或 “突变 "发 生 ,那么 忽视 这 些 变化 的 回归 模型 可 能 会 对 
推断 和 预 浏 提供 误导 性 偏差 。 








b 





名 ”关于 经 济 时 间 序列 变量 中 随机 性 趋势 及 其 给 回归 分 析 带 来 的 问题 前 进一步 讨论 ,请 见 Stock 与 Watson( 1988 ) 


对 于 一 个 随时 间 变 化 的 时 间 序 列 回归 函数 来 说 ,本 节 提出 诊断 突变 的 两 个 策略 。 第 一 
个 策略 从 假设 检验 方面 寻找 潜在 的 突变 ,并 需要 用 下 统计 荐 检验 回归 系数 的 变化 。 第 二 个 
策略 从 预测 方面 寻找 潜在 的 突变 ,你 故意 让 你 的 样本 比 实际 结束 得 早 , 并 对 你 已 做 出 的 预测 
进行 评价 。 当 预测 效果 明显 比 预 期 效果 差 时 ,就 可 以 发 现存 在 帘 变 。 


12.7.1 什么 是 突变 


突变 可 能 会 由 于 总 体 回归 系数 在 某 一 傅 定 日 期 的 其 种 离散 变化 而 产生 ,也 可 能 会 因为 
系数 在 一 段 较 长 的 时 间 里 逐渐 演变 而 出 现 。 

在 宏观 经 济 数 据 中 ,宏观 经 济 政策 的 重要 变化 是 离散 性 突变 产生 的 一 个 原因 。 例 如 ， 
1972 年 ,固定 汇率 的 布雷 顿 森林 体系 的 崩溃 ,造成 了 美元 /英镑 汇率 的 时 间 序 列 行为 的 帘 
变 , 这 在 图 12 一 2(b) 中 可 以 明显 地 看 出 。 在 1972 年 以 前 ,汇率 基本 上 是 不 变 的 ,除了 1968 
年 惟一 一 次 类 镑 贬值 ,当时 英镑 相对 于 美元 的 官方 价值 降低 了 。 相 反 , 自 1972 年 以 来 ,汇率 
在 非常 广泛 的 范围 内 波动 。 

突变 也 可 能 会 因为 总 体 回 归 随 时 间 的 演变 而 更 缓慢 地 发 生 。 例 如 ,经 济 政策 的 缓慢 演 
变 和 经 济 结构 的 不 断 变化 就 可 能 导致 这 种 突变 缓慢 地 发 生 。 本 节 所 措 述 的 检测 突变 的 方 
法 ,可 用 来 识别 两 类 突变 , 即 确定 性 变化 和 缓慢 演变 ， 

罕 变 所 引致 的 辣 题 。 如 果 在 样本 期 间 总 体 回 归 函 数 中 发 生 了 帘 变 ,那么 全 样本 的 OLS 
回归 估计 值 会 估计 “在 平均 意义 上 ”成 立 的 关系 ,也 就 是 说 ,这 个 估计 值 合并 了 两 个 不 同 的 
时 期 。 在 样本 末期 “平均 的 "回归 否 数 可 能 完全 不 司 于 真正 的 回归 函数 ,这 要 取决 于 突变 
的 位 置 和 大 小 ,因此 突变 会 导致 较 差 的 预测 。 


12.7.2 检验 突变 


识别 突变 的 一 种 方法 是 检验 回归 系数 的 离散 变化 或 突变 ,具体 怎样 做 取决 于 所 怀疑 的 
突变 发 生 的 日 期 {突变 日 期 {break date) ) 是 已 知 还 是 未 知 。 

日 期 已 知 时 突变 的 检验 。 在 某 些 应 用 中 ,你 可 能 会 怀疑 在 一 个 已 知 的 日 期 存在 突变 。 
例如 ,如 果 用 20 世纪 70 年 代 的 数据 研究 国际 贸易 关系 ,你 可 能 会 假设 汇率 的 总 体 回 归 函 数 
在 1972 年 存在 突变 , 那 时 固定 汇率 的 布雷 顿 森 林 体 系 被 放弃 ,取而代之 的 是 浮动 汇率 体系 。 

如 果 假 设 的 系数 突变 的 日 期 是 已 乱 的 ,那么 没有 突变 这 一 零 假 设 可 用 第 6 章 中 ( 见 重 
要 概念 6.4) 所 研究 的 二 元 变量 交互 回归 进行 检验 。 为 了 使 问题 简单 ,考虑 一 个 ADL(1,1) 
模型 ,这 样 有 一 个 截 距 项 .一 个 六 的 滞后 项 和 一 个 总 的 滞后 项 。 设 > 表示 假设 的 突变 日 
期 ,并 设 D,(7) 是 一 个 二 元 变量 , 它 在 突变 日 期 之 前 等 于 0, 而 在 突变 日 期 之 后 等 于 1, 因 此， 
Hrer ht, D, (r) =0; 当 1>7 时,D,(7) =1。 所 以 ,包括 这 个 二 元 突变 指示 变量 和 所 有 交叉 
项 的 回归 是 : 

Y, = B; +BY +A, +y DB (7) + HD Cr) XY, a] +y LD (Tr) x X... ] +u, (12.35) 

如 果 不 存在 突变 ,那么 两 部 分 样本 的 总 体 回归 函数 应 相同 ,因此 涉及 突变 二 元 变量 
Dt7) 的 项 就 不 会 进入 方程 (12. 35} 中 。 也 就 是 说 ,在 不 存在 突变 的 零 假 设 下 ,y=Y, = 为 = 
0, 在 存在 突变 的 备 择 假 设 下 ,总 体 回 归 函 数 在 突变 日 期 7 的 前 后 是 不 同 的 ,在 此 情况 下 至 
少 有 一 个 y 是 非 零 的 。 因 此 ,存在 突变 的 假设 可 以 在 至 少 有 一 个 y 是 非 零 的 备 择 假 设 下 , 通 
过 检验 零 假 设 y = y, =y =0 的 下 统计 量 进行 检验 ,这 个 检验 常 被 称 为 已 知 突变 日 期 的 分 
检验 ,是 以 其 创始 人 Gregory Chow(1960) 的 名 字 来 命名 的 。 

如 果 存 在 多 个 预测 因子 或 更 多 个 灌 后 项 ,那么 这 个 检验 可 以 通过 对 所 有 回归 因子 构造 

















二 元 可 变 的 交互 变量 ,并 检验 所 有 涉及 D,(7) 项 的 所 有 系数 都 为 0 的 假设 来 扩展 这 个 检验 。 

这 种 方法 可 以 进行 修改 以 检验 系数 子 集中 的 突变 ,通过 对 所 感 兴趣 的 回归 因子 的 子 集 
只 引信 二 元 变量 的 交互 项 来 实现 。 

突 空 日 期 林 知 时 突 空 的 检验 。 通 常 可 能 的 突变 日 期 是 未 知 的 ,或 只 在 一 定 范围 内 是 已 
知 的 。 俩 如 ,假设 你 怀疑 突变 发 生 在 两 个 日 期 7 和 7 之 间 的 某 个 时 候 , 对 邹 检 验 做 适当 修 
改 后 就 可 处 理 这 类 问题 。 具 体 来 说 ,可 通过 检验 在 re 和 7 之 间 所 有 可 能 日 期 7 的 突变 , 然 
后 用 所 得 的 最 大 的 统计 量 来 检验 未知 日 期 的 突变 。 这 个 修正 的 邹 检 验 有 个 不 同 的 称谓 ， 
mjii Quandt 位 然 比 [QLR) 统 计 蝇 (Quandt likelihood ratio statistic} { Quandt, 1960) (我 们 
要 用 这 个 术语 ) ,或 更 隆 梁 地 称 其 为 sup-Wald 统计 量 。 

由 于 QLR 统计 量 是 许多 下 统计 量 中 最 大 的 那个 ,因此 , 它 的 分 布 和 单个 FF 统计 量 的 分 
布 是 不 同 的 。 然 而 ,QLR 统计 量 的 交界 值 必须 从 一 个 特殊 的 分 布 中 得 到 。 像 FF 统计 量 一 
样 , 这 个 分 布依 赖 于 所 检验 的 约束 条 件 个 数 9, 即 在 备 择 假 设 下 允许 罕 变 或 变化 的 系数 的 个 
数 ( 包 括 截 踢 项 ) QLR 统计 量 还 依赖 于 ro 了 和 iT, 即 依 赖 于 用 来 计算 到 统计 量 的 子 样 
本 的 端点 m 和 和 7 , 它 被 表示 为 总 样本 容量 的 比重 。 

ATIE QLR 统计 量 分 布 的 大 样本 近似 做 得 比较 好 , 子 样本 端点 re fil 不 能 太 接 近 于 
样本 端点 。 由 于 这 个 原因 ,实际 中 的 QLR 统计 量 是 在 样本 的 一 个 “ 修 勾 "范围 或 子 集 上 计算 
的 。 通 常 的 选择 是 使 用 15% 6 2J. BDE z, =0. 157 和 Ti =0.857( 四 舍 五 人 到 整数 )。 在 
15%45J F ,突变 日 期 的 卫 统 计 和 量 是 在 样本 70 操 的 中 心 部 分 计算 的 。 

表 12 一 5 给 出 了 在 15 多 修 匀 下 计算 出 来 的 QLR 统计 量 的 临界 值 。 将 这 些 临 界 值 与 
-分 布 的 临界 值 ( 见 附 表 4) 相 比较 ,结果 表明 QLR SITE Ry h ñ B K. bb Y QLR 
统计 量 是 许多 单个 下 统计 量 中 的 最 大 的 那个 。 通 过 检查 许多 可 能 突变 日 期 的 FF 统计 量 ， 
QLR 统计 量 有 许多 机 会 可 拒绝 ,这 导致 了 QLR 临界 值 比 单个 下 统计 量 的 临界 值 大。 

像 分 检验 一 样 ,QLR 统计 量 也 可 被 用 来 集中 关注 只 在 某 些 回归 系数 上 存在 突变 的 可 能 
性 。 操 作 方 法 如 下 :首先 使 用 只 对 可 疑 系数 变量 的 二 元 变量 交互 项 计算 不 同 突变 日 期 的 邹 
检验 值 ,然后 计算 在 ners 范围 内 最 大 的 那个 分 检 验 值 。 这 种 形式 的 QLR 检验 的 临界 
值 也 可 以 从 表 12 一 $ 中 取得 ,其 中 约束 条 件 的 个 数 (q) 是 由 所 构成 的 下 检验 所 检验 的 约束 
条 件 的 个 数 。 

如 果 检 验 范 围 内 的 某 个 日 期 存在 离散 性 突变 ,那么 在 大 样本 条 件 下 ,0LR 检验 统计 量 
会 以 很 高 的 概率 拒绝 零 候 没 。 此 外 ,所 构成 的 下 统计 量 取 其 最 大 值 的 日 期 7 是 突变 日 期 + 


的 一 个 估计 值 。 这 个 佑 计 信和 是 个 好 的 估计 值 ,因为 在 一 定 的 技术 条 件 下 ,和 /7 一 7/T, 也 
就 是 说 ,在 整个 样本 期 间 发 生 突变 的 比例 被 一 致 地 估计 了 。 

当 存 在 多 个 离散 突变 ,或 突变 以 回归 函数 缓慢 演变 的 形式 出 现时 ,QLR 统计 量 在 大 样 
本 条 件 下 也 以 很 高 的 概率 拒绝 零 俱 设 。 这 意味 着 QLR 统计 量 识别 的 是 不 稳定 性 的 形式 ,而 
不 是 单个 离散 的 突变 。 因 此 ,如 果 QIR 统计 量 拒绝 了 零 假设 ,那么 可 能 意味 着 存在 单个 高 
散 突 变 ,或 存在 多 个 离散 突变 ,或 存在 回归 函数 的 缓慢 演变 。 

QLR 统计 量 在 重要 概念 12.9 中 总 结 。 

管 告 : 你 可 能 并 不 知道 突变 日 期 ,即使 你 自己 认为 已 经 知道 了 。 有 时 候 , 某 位 专家 可 能 
会 认为 自己 已 经 知道 了 可 能 的 突变 日 期 ,因此 可 以 用 邻 检 验 而 不 用 QLR 检验 。 但 如 果 这 种 
认识 是 以 专家 对 所 分 析 的 序列 的 认识 为 基础 的 笑 ,那么 实际 上 这 个 日 期 也 是 使 用 数据 估计 
出 来 的 ,尽管 是 以 非 正式 的 方式 。 对 突变 日 期 的 初步 估计 意味 着 ,通常 的 严 临 界 值 不 能 用 





于 那个 日 期 突变 的 邹 检 验 。 因 市 ,在 这 种 情况 下 司 用 QLR 统计 量 仍然 是 适当 的 。 





表 12 一 5 15% fE AR OLR 统计 量 临 界 值 

zpk at DE) 10% Se I% 
1 1.12 8. 68 12.16 
2 5.00 5.86 7.78 
3 4 09 4.71 6.02 
4 3 59 4. 09 5. 12 
5 3 26 3.66 4.53 
6 3,02 3.37 4.12 
7 2.84 3. 15 3. 82 
8 2.69 2.98 3.57 
9 2.58 2.84 3, 38 
10 2.48 2.71 3.23 
11 2.40 2.62 3.09 
12 2,33 2.54 2.97 
13 2.27 2.46 2,87 
14 2.21 2.40 2,78 
15 2.16 2.34 2.71 
16 2.12 2.29 2.64 
17 2. 08 2.25 2.58 
18 2. 05 2.20 2, 53 
19 2.01 2.17 2.48 
20 1.99 2.13 2.43 


注 : 当 mo =@ 157,7; =0.85T( RARER, w se IB i Plt, F 统计 董 荐 对 样本 ?0 名 的 
中 心 部 分 中 所 有 潜在 的 突变 唱 期 计算 的 。 约 束 条 件 个 数 9 是 每 个 单个 下 统计 量 所 检验 的 约束 条 件 的 个 
数 。 很 感谢 Donald Andrwes 向 我 们 提供 这 个 表格 ,取代 了 Andrwes(1993) 中 的 表 1。 


重要 概念 12. 9 


系数 稳定 性 的 QLR 检验 
设 F(7) 表 示 在 时 期 7 的 回归 系数 中 存在 突变 这 个 假设 的 正统 计量 ,例如 ,在 公式 
(12.35) 的 回归 中 ,就 是 检验 零 假 设 广 = 为 = 为 =0 的 下 统计 量 。QLR{ 或 sup-Wald) 检 验 是 
在 ms7<ri 范围 内 的 最 大 的 那个 统计 量 。 
QLR=ma[F(za) ,FPCro +1) F(r.)] (12.36) 
l. 和 下 统计 量 一 样 ,QLR 统计 量 可 用 来 检验 全 部 回归 系数 的 罕 变 ,也 可 用 来 检验 只 有 
部 分 回归 系数 的 突变 。 
2. 在 大 样本 条 体 下 ,QLR 统计 量 的 分 布 在 零 假 设 下 依赖 于 所 检验 的 约束 条 件 个 数 9 和 
作为 了 的 一 个 部 分 的 端点 70 和 7,。15% 修 勾 的 临界 值 (7。=0.15T 和 7 =0. 857, UREA 














p 


到 整数 ?在 表 12 一 5 中 给 出 。 

3. QER 检验 可 识别 单个 离散 突变 、 多 个 离散 突变 和 回归 函数 的 缓慢 演变 。 

4. 如 果 回 归 函 数 中 存在 一 个 确定 的 突变 ,那么 最 大 的 邹 统 计量 发 生 的 日 期 是 突变 日 时 
期 的 一 个 估计 量 。 

NE Edu W ze Em? QLR 检验 提供 了 一 种 检验 从 1962 年 到 1999 年 非 利 浦 斯 
曲线 是否 稳定 的 方法 。 上 有 具体 来 说 ,我 们 关注 在 An, 和 Unemp, 每 个 都 包含 四 阶 澡 后 项 的 公 
式 (12,17) 的 ADL(4,4) 设 定 中 ,失业 率 的 灌 后 值 系 数 和 截 趾 项 是 否 已 发 生 了 变化 。 

公式 {12. 17) 中 的 截 距 项 和 Wnemp,_1，…, Unemp, -的 系数 都 为 常数 的 零 假 设 和 在 给 定 
日 期 发 生 突 变 的 备 择 假设 ,检验 这 两 个 假设 的 分 检验 玉 统 计量 的 图 形 在 图 12-—5 中 绘制 ,网 
中 给 出 了 710 驼 的 样本 中 心 部 分 的 突变 。 例 如 ,检验 在 1980: ] 存在 突变 的 玉 统 计量 为 
2. 26 ,该 日期 的 值 在 图 12 一 5 中 做 了 标示 。 每 个 F 统 计量 检 验 5 个 约束 条 件 ( 截 蝶 项 和 失业 
率 灌 后 项 的 4 个 系数 都 不 发 生变 化 ) ,因此 ,g =5。 这 些 卫 统计 量 的 最 大 值 是 3. 53 , 它 发 生 
在 1982: 工 ,这 就 是 QLR 统计 量 。 将 3. 53 与 表 12.5 中 9 =5 的 临界 值 相 比较 表明 ，“ 这 些 系 
数 是 稳定 的 "假设 在 10% 的 显著 性 水 平 下 { 临界 值 是 3. 26) 被 拒绝 ,但 在 5 多 的 显著 性 水 半 
下 (临界 值 是 3. 66) 不 能 被 拒绝 。 因 而 ,存在 一 定 的 证 据 表明 ,这 5 个 系数 中 至 少 有 -个 系 
数 在 样本 期 间 已 发 生变 化 ,但 这 种 证 据 并 不 特别 明显 。 
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1960 1965 1970 1975 1980 1985 1990 1995 2000 

突变 日 期 (年) 
注 :在 给 定 的 突变 日 期 ,这 里 所 绘制 的 下 统计 量 检验 方程 (12. 17) 中 的 Unermp,-，， Whemp,-，， 
Unemp,_3 ,Demp,，, 系 数 或 截 距 中 至 少 一 个 有 突变 的 零 假 设 。 例 如 ,检验 在 1980; 工 突 变 的 了 统计 量 为 
2.26, QLR 统计 量 是 这 些 下 统计 量 中 的 最 大 值 , 它 是 3. 53, 它 超过 10% 的 临界 值 3. 站, 但 小 于 5% aoi 


界 值 3. 66. 
图 12.5 在 不 向 日 期 检验 方程 112. 17) 中 突变 的 下 统计 量 


12.7.3 伪 样 本 外 预测 


一 个 模型 被 估计 出 来 之 后 ,对 该 预测 模型 的 最 终 检 验 是 它 在 样本 外 的 表现 效果 ,也 即 它 
在 “真实 世界 ” 星 的 预测 效果 。 伪 样本 外 预测 (pseudo out-of-sample forecasting) 是 对 一 个 
预测 模型 模拟 其 在 真实 时 间 表 现 效果 的 方法 。 伪 样本 外 预测 的 思想 很 简单 :选择 一 个 在 样 


本 终点 附近 的 日 期 ,用 直 色 该 日期 的 数据 估计 你 的 预测 模型 ,然后 用 那个 所 估计 的 模型 进行 
项 测 。 对 伴 本 终点 附近 的 多 个 日 期 执行 这 个 操作 ,得 到 一 系列 的 伪 预 测 值 和 伪 预 测 误差 。 
于 古 , 这 个 伪 贡 测 误差 就 能 被 用 来 判断 ,如 果 须 测 关系 是 平稳 的 ,那么 这 些 预测 是 否 代表 了 
你 所 期 望 的 预测 值 。 

之 所 以 称 其 为 * 伪 "样本 外 预测 ,是 因为 它 并 不 是 真实 的 样本 外 预测 。 真 实 的 样本 外 预 
测 发 后 在 真实 的 世界 里 ,也 就 是 说 ,在 不 知道 一 个 序列 未 来 值 给 你 所 带 来 的 好 处 的 条 件 下 进 
行 预测 。 在 伪 样 本 外 预测 中 ,你 用 你 的 模型 模拟 真实 时 间 的 预测 ,但 你 有 “未 来 的 "数据 , 依 
靠 它们 评价 那些 模拟 的 预测 或 伪 预 测 。 伪 样本 外 预测 模拟 了 在 真实 世界 时 可 能 发 生 的 预测 
过 程 ,但 不 用 等 待 新 数据 的 到 来 。 

伪 样 本 外 预测 给 预测 者 一 种 在 样本 末端 模型 被 预测 得 好 坏 的 感觉 。 这 可 以 提供 有 价值 
的 信息 ,要 么 支持 该 模型 -- 直 被 预测 得 很 好 这 种 信心 ,要 么 表明 该 模型 在 刚刚 过 去 的 时 间 里 
远离 了 轨道 。 伪 样本 外 预测 方法 在 重要 概念 12. 10 中 总 结 。 


重 可 概念 12. 10 


伪 样 本 外 预测 
伪 样 本 外 预测 按 下 列 步 又 计算 ; 
1. 选择 一 个 用 于 生成 伪 样 本 外 预测 的 观测 期 数 P, 例 如 ,P 可 能 是 样本 容量 的 10% 3 
15%, s=T-P, 
2. 用 缩短 了 的 这 个 数据 集 对 上 = 1,…, 居 计 预测 的 回归 方程 。 


3. 计算 在 这 个 缩短 的 样本 之 外 第 一 个 时 期 +1 的 预测 值 ,我 们 将 其 称 之 为 立 ,，。 


4. 计算 预测 误差 ,站 ,, = Y... -Pano 
5. 对 余下 的 时 期 ,从 ;= 了 -P+1 到 了 -1, 重 复 步骤 2 ~4( 在 每 个 时 期 重新 估计 这 个 回 


归 方 程 ) 。 伪 样本 外 预测 值 是 | 艺 ,，,s = 了 -~ P,，……7- 1 ，, 擅 样 本 外 预测 误差 是 [ 立 j,s = 了 
-PT-1|, 

伪 样 本 外 葬 测 的 其 他 用 途 。 伪 样本 外 预测 的 第 二 个 用 途 是 估计 RMSFE。 由 于 伪 样 本 
外 预测 值 只 用 预测 时 期 以 前 的 数据 计算 ,因此 , 伪 样 本 外 预测 误差 反映 了 与 误差 项 的 未 来 值 
有 关 的 不 确定 性 和 由 于 估计 回归 系数 所 引起 的 不 确定 性 ,也 就 是 说 ,这 个 伪 样 本 外 预测 值 包 
合 了 公式 (12.21) 中 的 两 个 误差 来 源 。 因 而 ,这 个 伪 样 本 外 预测 误差 的 样本 标准 差 是 
RMSFE 的 一 个 估计 量 。 如 12.4 节 中 所 讨论 的 ,RMSFE 的 这 个 估计 量 能 用 来 量化 预测 不 确 
定性 和 和 构造 预测 区 间 。 

伪 样 本 外 防 测 的 第 三 个 用 途 是 ,对 两 个 或 更 多 的 候选 预测 模型 进行 比较 。 两 个 看 起 来 
同样 好 地 氢 合 了 样本 数据 的 模型 ,在 伪 样 本 外 预测 练习 中 的 表现 可 能 完全 不 同 。 当 模型 不 
同时 ,例如 , 当 它 们 包含 不 同 的 预测 因子 时 , 伪 样 本 外 预测 提供 了 比较 这 两 个 模型 是 否 能 提 
供 可 靠 预测 结果 的 一 种 简便 方法 。 

应 用 : 菲 利 浦 斯 曲线 在 20 12190 年 代 是 和 否 发 生 了 变化 ?如 果 非 利 浦 斯 曲线 的 系数 在 
20 世纪 如 年 代 发 生变 化 ,那么 在 此 期 间 计算 的 伪 样 本 外 预测 值 会 变 得 很 糟糕 。 从 1994; I 
到 1999: 风 期 间 ,用 四 阶 濡 后 的 菲 利 浦 斯 曲线 所 计算 的 通货 膨胀 的 伪 样 本 外 预测 值 ,连同 通 
货 膨胀 的 实际 值 一 起 绘制 在 图 12 一 6 中 。 例 如 ,1994: 工时 期 通货 膨胀 的 预测 值 是 这 样 来 计 
算 的 ;使 用 从 开始 到 1993. N 的 数据 ,用 Am XE Anf attt Anf, 4, Unemp, 1,17, Unemp, 4 








而 且 这 种 不 稳定 性 导致 了 偏 高 的 通货 膨胀 变化 的 预测 值 。 在 这 个 模型 用 于 真实 世界 的 预测 
之 前 ,尽力 识别 这 个 漂移 的 来 源 , 并 将 其 综合 到 菲 利 浦 斯 曲线 模型 的 修正 形式 中 ,这 一 点 是 
非常 重要 的 。 

放 到 一 起 来 说 ,这 种 伪 样 本 外 预测 中 的 偏差 和 QLR 统计 好 (在 10% 的 显著 性 水 平 下 ) 
对 平稳 性 的 拒绝 ,表明 了 这 个 四 阶 滞后 的 菲 利 浦 斯 曲线 是 不 平稳 的 。 这 种 不 平稳 性 在 20 世 
¿n 90 年 代 期 间 和 2] 世纪 初期 是 很 值得 考虑 的 问题 ,因为 经 济 预 测 者 认识 到 基于 菲 利 浦 其 
曲线 的 通货 膨胀 预测 值 太 高 ,如 图 12 一 6 所 示 。 一 些 宏观 经 济 学 家 认为 这 种 不 平稳 性 的 根 
源 是 20 世纪 90 年 代 自 然 失 业 率 的 下 降 , 它 使 我 们 所 研究 的 回归 的 截 距 向 负 的 方面 变化 。 
不 过 ,其 他 一 些 实 观 经 济 学 家 却 认 为 这 种 分 析 是 更 完全 的 , 菲 利 浦 斯 曲线 的 整体 概念 一 一 连 
接 过 度 需 求 压力 和 整体 价格 通货 膨胀 之 同 的 关系 一 一 只是 前 信息 时 代 经 济 的 一 个 陈旧 的 特 
征 。 如 果 有 兴趣 进一步 阅读 关于 这 方面 的 争论 ,请 见 《经 济 展望 杂志 》1997 年 冬季 刊 关于 菲 
利 浦 斯 由 线 的 专题 讨论 。 


12.7.4 避免 由 突变 所 引致 的 问题 


调整 首 体 回归 函数 中 突变 的 最 好 方法 取决 于 该 突变 的 来 源 。 如 果 一 个 确定 的 突变 发 生 
在 某 一 特定 的 日 期 ,那么 这 个 突变 将 会 以 很 高 的 概率 被 QLR 统计 量 所 识别 ,而 且 能 够 估计 
出 突变 发 生 的 日 期 。 因此 ,可 以 使 用 代表 与 这 个 突变 有 关 的 两 个 子 样本 的 一 个 二 元 变量 来 
估计 这 个 回归 函数 ,必要 时 可 引入 其 他 的 回归 因子 起 交互 作用 。 如 果 所 有 的 系数 都 发 生 了 
突变 ,那么 这 个 回归 采纳 公式 (12. 35) 的 形式 ,其 中 7 由 所 估计 的 突变 日 期 7 代替 ,但 如 果 
只 有 部 分 系数 发 生 了 宽 变 ,那么 只 有 相关 的 交互 作用 项 出 现在 回归 中 。 如 果 确 实 存 在 确定 
的 突变 ,那么 关于 回 妇 系 数 的 推断 可 以 如 往常 一 样 进行 ,比如 使 用 基于 ; 统计 车 的 假设 检验 
通常 的 正 态 临 界 值 。 此 外 ,还 可 使 用 适用 于 样本 末端 的 所 估计 的 回归 函数 进行 预测 。 

如 果 窒 变 不 明显 ,而 是 由 参数 缓慢 的 正在 进行 的 变化 所 引起 的 ,那么 补救 措施 更 为 困 
难 ,而 且 超 出 了 本 书 的 范围 中 。 





[12.8_ 结论 ] 


在 时 间 序 列 数 据 中 ,变量 在 不 同 观 测 值 或 时 期 之 间 通 常 是 相关 的 。 这 种 相关 的 结果 是 ， 
可 以 根据 该 时 间 序 列 的 当前 值 和 过 去 值 , 使 用 线性 回归 方法 局 测 它 的 未 来 信 。 时 间 序 列 回 
归 的 出 发 点 是 自 回归 ,也 即 回 归 因 子 是 因 变量 滞后 值 的 回归 。 如 果 可 闭 得 额外 的 预测 因子 ， 
那么 可 以 将 它们 的 沸 后 项 添加 到 回归 中 。 

本 章 考虑 了 在 使 用 时 间 序 列 数据 估计 和 使 用 回归 时 出 现 的 若干 技术 问题 。 一 个 问题 是 
确定 包含 在 回归 中 的 滞后 项 的 个 数 。 如 12. 5 节 中 所 讨论 的 ,如 果 选 择 的 是 使 BIC 最 小 化 的 
滞后 阶 数 ,那么 所 估计 的 滞后 长 度 与 真实 的 满 后 长 度 是 一 致 的 。 

另 一 个 问题 是 ,所 分 析 的 序列 是 不 是 平稳 的 。 如 果 所 分 析 的 序列 是 平稳 的 ,那么 就 可 使 
用 通常 的 统计 推断 方法 (例如 ,将 统计 量 与 正 态 分 布 临界 值 进行 比较 ) ,而 且 因 为 总 体 回归 
函数 随时 间 推 移 是 稳定 的 ,所 以 用 历史 数据 所 估计 的 回归 方程 能 被 可 靠 地 用 于 预测 。 但 如 
果 所 研究 的 序列 是 非 平稳 的 ,那么 情况 就 会 变 得 更 加 复杂 ,其 中 具体 的 复杂 程度 取决 于 这 个 
非 平稳 性 的 性 质 。 例 如 ,如 果 一 个 序列 因 含 有 随机 性 趋势 而 变 成 是 非 平稳 的 ,那么 所得 的 








O 对 存在 离 考 性 突变 时 的 估计 和 检验 的 更 多 讨论 ,请 见 Hansen( 2001) 。 对 存在 系数 缓慢 演变 时 突变 的 估计 和 蔬 
测 的 高 级 讨 沦 , 请 见 Hamilion(1994, 第 13 $), 


HAAA ADER h RER Quandt 似 然 比 (QLR) 统 计量 伪 样 本 外 预测 
[复习 概念 - 


12.1 观察 图 12 一 2(e) 中 日 本 实际 GDP 的 对 数 图 。 这 个 时 间 序 列 看 上 去 是 平稳 的 
吗 ? 请 解释 说 明 。 假 设 你 计算 了 这 个 序列 的 一 阶 差 分 , 它 看 上 去 会 是 平稳 的 吗 ? 请 解释 

12.2 许多 您 融 经 济 学 家 认为 随机 游 动 模型 是 股票 价格 对 数 的 一 个 很 好 的 措 述 。 这 隐 
含 着 ,股票 价格 的 百分比 变化 是 不 可 预测 的 。 一 位 金融 分 析 师 声称 他 有 一 个 比 随机 游 动 模 
型 预测 能 力 更 好 的 新 模型 。 请 解释 你 将 如 何 检 验 这 位 分 析 师 认为 他 的 模型 更 好 这 一 观点 。 

12.3 一 位 研究 人 员 估 计 了 一 个 含有 截 中 的 AR(1) ,并 求 出 记 的 OLS 估计 秆 为 0. 95， 
标准 误 为 0. 吧 。 一 个 95 名 的 属 信 区 间 会 包含 B, =1 吗 ? 请 解释 说 明 。 

12.4 ”假设 你 怀疑 公式 (12. 17) 中 的 截 距 在 1992; I 发 生 了 变化 , 称 打算 如 何 修 正 这 个 
方程 以 体现 这 个 变化 ? 你 怎样 检验 该 截 中 的 变化 ”如果 你 不 知道 变化 的 日 期 ,你 将 如 何 检 
验 该 截 距 的 变化 ? 


[练习 - 


“12, 1 假设 并 满足 平稳 的 AR(1) 模 型 了 =2.5+0.77_, + 羽 ; 其 中 ,uw 为 独立 同 分 
布 ,E(u) =0,var(v,) =9, 

a. 计算 了 的 均值 和 方差 。 

b. HË Y, 的 前 二 阶 自 协 方差 。 

ce. 计算 Y, 的 前 二 阶 自 相 关系 数 。 

d. 8 Y, = 102. 3, Ypnr = El Ypa l Yr, Ypa) 

12.2 工业 生产 指数 (1P,) 是 一 个 测量 某 一 月 份 内 生产 的 工业 产品 数量 的 月 度 时 间 序 
列 。 本 问题 使 用 美国 关于 这 个 指数 的 数据 。 所 有 的 回归 都 是 在 1960:1 到 2000:12( 即 从 
1960 年 1 月 份 到 2000 年 12 月 份 } 的 样本 期 间 估 计 的 。 设 了 =1 200 x lnCP.AIP,.1) o 

a 预测 者 说 ,用 年 度 百分点 测度 的 也 反映 了 J 到 月 度 百分比 的 变化 。 他 的 观点 正确 吗 ? 
为 什么 ? 

b. 假设 一 位 预测 者 对 Y, 估计 了 如 下 的 AR{4) 模 型 ; 


$ = 1.377 + 0.318 了 + 0.123 Y. ,+ 0.068 Y... + 0.001 Y,., 
(0.062) (0.078) (0.055) (0.068) (0.056) 


利用 表 12 一 6 中 从 2000 年 7 月 到 2000 年 过 月 的 全 值 ,使 用 这 个 AR(4) 模 型 预测 
2001 1 HH Y, š. 























#12—6 2000 # 7 月 到 2000 年 12 月 的 严 值 
时 期 2000:7 2000 :8 2000 ;9 2000:10 2000:11 2000;12 
IP 147. 595 148. 650 148. 973 145. 660 148, 206 147. 300 





-一 一 
o 由 于 担心 生产 中 存在 潜在 的 季节 波动 ,该 预测 者 将 了 ,_1, 深 加 到 了 自 回归 模型 中 。 所 
估计 的 Y. ARRE -0.054 ,标准 误 为 0.053。 这 个 系数 在 统计 上 是 否 是 显著 的 ? 
d. 由 于 担心 存在 潜在 的 突变 ,她 计算 了 AR(4) 模 型 中 的 常数 项 和 AR 系数 的 {在 15% 
修 匀 下 )QLR 检验 统计 其 ,相应 的 QLR 统计 量 为 3. 43。 这 里 存在 突变 的 证 据 吗 ? 请 解释 


ELE F-ino kaea 











说 明 。 

e， 由 于 担心 白 己 可 能 在 模型 中 包含 了 太 多 或 者 太 少 的 滞后 项 ,该 预测 者 在 同样 的 样本 
期 间 估 计 了 p=],…,6 的 ARtp) 模 型 。 这 些 估 计 模 型 中 每 一 个 模型 的 残 差 平方 和 都 显示 
在 表 12 一 ? rh. 用 BIC 准则 估计 自 回 归 中 应 该 包含 的 滞后 阶 数 。 如 果 使 用 AIC ,结果 会 不 





同 吗 ? 
表 12 一 ”7 估计 样 型 的 残 差 平 方 和 
AR BH l 2 3 4 5 6 
SSR 29 175 28 538 28 393 28 391 28 378 28 317 


"12.3 ”利用 与 练习 12.2 相同 的 数据 ，- 位 研究 人 员 用 下 列 回归 检验 了 In ( TP.) PHBE 
机 性 趋势 ， 


— 
Aln(IP,)- 0.061 + 0.00004 - 0.018 ln JP., + 0- 333 Aln iP )+ 0. 6 Aln( IP) 
(0.024) (0.00001) (0.007) (0.075) (0.055) 


其 中 显示 在 括号 内 的 标准 误 是 用 仅 适 用 于 同方 关 的 公 趟 计算 出 来 的 ,而且 加 是 因 工 。 E 
—FbrERFIBJ SS pu. 

a. 用 ADF 统计 基 检 验 In( IP) 中 的 随机 性 趋势 (单位 根 ) 。 

b， 这 些 结论 是 否 支持 练习 12.2 中 所 使 用 的 设 定 ”请 解释 说 明 。 

12.4 练习 12. 2 中 的 那 位 预测 者 将 她 对 严 增长 的 AR(4) 模 型 扩展 为 包含 AR, 的 四 阶 
MERE R. 是 3 个 月 美国 短期 国债 利率 (用 年 度 百 分 点 测量 ) 。 

a AR, 的 四 阶 滞后 的 格 兰 杰 因果 关系 卫 统 计量 为 2 35。 利 率 有 助 于 预测 IP 的 增长 吗 ? 
请 解释 说 明 。 

b ZARARA AR, 对 -- 个 常数 AR, BORA EA IP 增长 的 四 阶 滞 后 进行 回归 ， 
所 得 的 关于 IP 增长 的 四 阶 潍 后 的 格 兰 杰 因果 关系 下 统计 量 为 2,87。 大 增长 有 助 于 预测 利 
率 吗 ? 请 解释 说 明 。 

12.5 证 明 下 肇 关于 条 件 均值 .预测 值 和 预测 误差 的 结论 。 

a 设 丈 是 个 均值 为 ww 上 且 方差 为 wy 的 随机 变量 ,并 设 * 为 一 常数 。 证明 :E[ (W - 
e) ] =ə% + (ae =c) 

b. #|2E T V... Ya o HAGE, 2 EMA y, 的 问题 。 设 .表示 Y, 的 某 个 预测 值 ,其 
| 的 下 角 标 - 1 表示 预测 值 是 从 开始 到 1 - 1 期 数据 的 函数 , 设 EL (Y. - f. Y Iy... 

Y,.,,… EHME ,的 条 件 均 方 误差 , 它 是 以 从 开始 到 :1-1 期 了 的 观察 值 为 条 件 的 。 证 
Aa = ,时 ,条 侍 均 方 预测 误差 最 小 ,这 里 卫 ,， = E(Y IV. 1, 了 .2,…)。( 提 示 : 将 
(a) 的 结论 推广 到 条 件 期 望 ) 

e. 证 明 ;AR(p) (重要 概念 12.3 中 的 公式 (12. 14) ) 的 误差 项 u 是 序列 无 关 的 。{( 提 
示 : 利 用 公式 (2.25) ) 

12.6 在 本 练习 中 ,你 将 执行 12.6 节 中 所 讨论 的 一 个 研究 伪 回 归 现 象 的 蒙特 卡 洛 模 拟 
实验 。 在 蒙特 卡 洛 研究 中 ,用 计算 机 生成 人 工 数据 ,然后 用 这 些 人 工 数据 计算 所 研究 的 统计 
量 。 当 已 知 模型 统计 量 分 布 的 数学 表达 式 很 复杂 ( 像 这 里 一 样 ) 甚 至 是 未 知 的 时 ,蒙特 卡 洛 
模拟 实验 使 得 计算 这 些 统计 量 的 分 布 成 为 可 能 。 在 本 练习 中 ,你 将 生成 数据 ,使 得 两 个 序列 
Y, 和 X, 是 独立 分 布 的 随机 游 动 ,具体 步 又 是 : 

i. 用 计算 机 生成 一 列 了 = 100 的 独立 同 分 布 的 标准 正 态 随机 变量 。 将 这 些 变 量 记 为 
el ,emo EY =e, Y. = Y_ +e, t=2,3,-. .100。 


H. 用 计算 机 生成 一 个 新 的 .了 = 100 的 独立 网 分 布 标准 正 态 随机 变量 a, 6; ,*…, Gwo 
IR X =a, X, =X, +a 1=2,3,.. 100. 

iii. RJ Y, 对 常数 和 XX 回归。 计算 OLS 估计 其 . 同 归 的 六 ,以 及 检验 B (X, 的 系数 ) 为 0 
的 零 假 设 的 ( 仅 适 用 于 间 方 差 的 )# 统计 量 。 

根据 以 .FEF 算法 回答 下 列 间 题 ; 

a ACi) - (十) 进行 一 次 运算 。 利 用 通常 的 5% 临 界 值 1.96, 使 用 ( 坦 ) 中 的 1 统计 量 
检验 有 =0 的 零 假设 。 你 所 估计 的 回归 的 六 是 多 少 ? 

b. 重复 (a)1 000 次 ,保存 每 个 六 和 4: 统计 量 的 值 。 构 造 一 个 请 和 1 统计 量 的 直方 图 。 
R° 和 4 统计 量 分 布 的 5% ,50% ,95% 站 分 位 数 分 别 是 多 少 ? 在 1 000 个 模拟 数据 集中 ,# 统 
计量 的 绝对 值 大 于 1. 96 的 比重 有 多 大 ? 

e. 按 不 同 的 观测 值 数 重复 (b) 的 步骤 ,例如 7 了 =50 和 了 =200。 随 着 样本 容量 的 增加 ， 
由 于 已 生成 的 了 和 是 独立 分 布 的 .拒绝 零 假设 的 次 数 比 重 接近 5 免 码 ” 随 着 了 变 大 ,这 个 
比重 值 看 起 来 会 接近 于 某 个 其 他 的 根 限 值 吗 ?” 那个 极限 值 是 多 少 ? 


[附录 12.1 第 12 章 中 所 使 用 的 时 间 序 列 数据 - 


美国 的 宏观 经 济 时 间 序 列 数据 由 不 辐 的 政府 机 构 搜集 和 发 布 。 美国 的 消费 者 价格 指数 
是 用 月 度 调 查 数据 测度 的 ,并 由 劳工 统计 局 ( BLS ) 编 辑 。 失 业 率 是 根据 BLS 的 当前 人 口 普 
查 ( 见 附录 3. 1) 的 数据 计算 的 。 这 里 所 用 的 季度 数据 是 根据 对 月 度数 值 取 平 均 数 计算 的 。 
联邦 基金 利率 是 联邦 储备 委员 会 报告 的 日 利率 的 月 度 平 均 ,而 美元 “英镑 汇率 数据 是 日 汇率 
的 月 度 平均 ,两 者 都 是 对 该 季度 的 最 后 月 份 而 言 的 。 日 本 的 实际 GDP 数据 是 从 OECD 得 到 
B. NYSE 综合 指数 的 日 百分比 变化 是 用 10041ln( NYSE, 计算 的 ,其 中 和 NYSE, 是 纽约 股票 
交易 所 的 日 收盘 措 数值 。 因 为 股票 交易 所 在 局 末 和 节假日 不 营业 ,所 以 ,分 析 的 时 期 是 营业 
口 。 这 些 以 及 许多 其 他 的 经 济 时 间 序 列 在 不 同 数 据 搜集 机 构 的 相关 网 站 上 可 以 免费 获得 。 


[附录 12. 2 _AR( 1) 模型 中 的 平稳 性 ] 


本 附录 证 明了 ,如 果 1B,1 <1 B u, 是 平稳 的 ,那么 Y, 就 是 平稳 的 。 回 想 一 下 重要 概念 
12.5 中 的 内 容 , 如 果 ( 卫 ,, ,… ,了 ,,7) 的 联合 分 布 不 依赖 于 ;, 那 么 时 间 序 列 变量 Y, 就 是 平稳 
的 。 为 了 使 论证 简单 化 ,在 简化 的 假设 B=0 和 iw1 服 从 独立 同 分 布 NO0,.;) F ,我们 正式 
证 明 7=2 的 情形 。 

第 一 步 是 依据 u, FY, RER HTA =0, 因 此 公式 (12.8) 隐 合 着 }, ATi + 
u ÉY BY ;+ 代入 到 这 个 表达 式 中 ,得 到 Y=B1 (B.Y... +u...) +u, =Y, + 
Bu ,+ 下。 继续 另 一 步 的 这 个 替代 ,得 到 站 BY +B tBu +u, ARRESE T 
去 ,可 得 到 ; 





Y, =, +A,n,_, +Ëu,-: +u, +=. = >, Bitra, (12. 37) 


Bm, Y, E u, AERA AE A u, 服从 正 态 分 布 ,而 且 正 态 随 
机 变量 的 加 权 平 均 也 是 正 态 的 [ 见 2 6 节 ), 所 以 了 ,和 了 ,服从 双 变 量 的 正 态 分 布 。 回 想 
一 下 2.6 节 , 双 变量 的 正 态 分 布 完全 由 两 个 变量 的 均值 .方差 和 协 方差 所 决定 。 因 此 ,要 证 
HH Y, 是 平稳 的 ,我 们 需要 证 明 (Y,,, ,Y,,;) 的 均值 .方差 和 协 方差 不 依赖 于 s。 下 面 使 用 的 该 


Ar El m= 








= 
ibi 


命题 的 扩展 形式 可 用 来 证 明 (,, ,… ,了 ,7) 的 分 布 不 依赖 于 so 
了 ,和 了 ,的 均值 和 方差 可 用 公式 (12,37) 来 计算 ,但 尝 要 用 下 前 标 s+1 或 +2 代替 


t 首先 ,由 于 对 所 有 的 :有 E(w) =0,E(Y) =E( X giu) - X Eu) -0 .因此 





7 ， 和 了 ,的 均值 都 为 0, 尤 其 是 它们 不 依赖 于 s Ek, var(Y,) = var( > Bu) 
= > (Bi) var(u,_,) = > (B: )° =o(l -B) ,这 里 最 后 一 个 等 式 由 下 列 事实 得 出 ， 


如 果 lal <1, 则 于 w =1(1 -ao) ,因而 war( 了 ，) = var( Y...) 203/01 -8), REB, < 
1=0 


1, 它 就 不 依赖 于 *。 最 后 ,由 于 ,下 =BY +t cov Yus V...) = E(Y, Ya) = 
ELY, a (B.Y... +u, )] =Bivar( Y...) + cov( Ys 2) =Bvvar( Y,,,) =fr, l - B) , 因 
此 , 协 方差 不 依赖 于 s。 所 以 ,了 ,,, 和 了 ,, 具 有 一 个 不 依赖 于 s 的 联合 概率 分 布 ,也 就 是 说 , 它 
们 的 联合 分 布 是 平稳 的 。 如 果 i811 宕 1 ,那么 这 个 计算 就 无 效 , 因 为 公式 (12. 37) 中 的 无 穷 和 
不 收 敏 ,的 方差 是 无 限 的 。 因 此 ,如 果 18 1<1, 那 么 六 恩 是 平稳 的 ,但 如 果 房 =1, 则 也 
是 非 平稳 的 。 

前 面 的 争论 是 在 B=0 和 服从 正 态 分 布 的 假说 下 进行 的 。 如 果 启 关 0 ,那么 结论 基 
相似 的 ,但 了 ,, 和 YY,,, 的 均值 变 成 了 BA(1 -有 ) ,而 且 必 须 对 方程 (12. 37) 进行 非 零 均值 的 
BE. s 是 独立 同 分 布 的 正 态 假设 ,可 被 x 是 平稳 的 并 且 具 有 有 限 的 方差 这 一 假设 来 代 
幸 , 因 为 依据 公式 (12. 37 ) Y, 仍 可 以 表示 为 u, 的 当前 值 以 及 过 去 值 的 函数 ,所 以 只 要 的 
分 布 是 平稳 的 , 且 公 式 (12.37) 中 的 无 窃 和 是 有 意义 的 (也 即 它 收 合 ,这 要 求 18,1 <1) ,那么 
Y, 的 分 布 就 是 平稳 的 。 


附录 12.3_ 滞后 算 子 符号 1 


通过 采用 熟知 的 滞后 算 子 符号 ,本 章 以 及 下 两 章 中 的 符号 被 大 大 地 简化 。 设 荆 表 示 灌 
后 算 子 (lag operator) , 它 具 有 将 变量 变换 为 它 的 滞后 项 的 性 质 ,也 就 是 说 ,滞后 算 子 上 具有 
HR LY, =Y_,。 通 过 使 用 两 次 滞后 算 子 ,可 以 得 到 二 阶 滞后 , 即 CY = L(LY,) = LY, = 
Y_,。 更 _ 般 地 说 ,通过 使 用 六 次 滞后 算 子 , 可 以 得 到 BE. BZ, WJ E T B mF 











性 质 ， 
LY, =Y, PPY, =Y, 3, UY =Y, (12.38) 
W E Tik AFRESH EE 6 IR (lag polynomial) , 它 是 一 个 用 河 后 算 子 表示 的 
EMA. 
alL) =a +o L +a, t +a 1 = Y sr (12.39) 


其 中 ,am ，…w 是 洁 后 多 项 式 的 系数 , 且 L =1。 公 式 (12. 39) PRESTA alL RKR 
pe MaL Y, 得 到 : 
afL)Y =( $ œL )}Y, = > mw (LY) = > a Y, =a +t Y, te +a Y,_, (12.40) 
公式 (12. 4 中 的 表达 式 隆 含 着 公式 (12. 14) 中 的 AR(p) 模 型 可 被 简写 为 : 
a(L)Y, =P +u, (12.41) 
其 中 ,om =l Ba = -有 BJ=1,…p。 同 样 ,ADLCP,9) 模 型 可 写 为 : 





alL) Y =B +e(L)X +u, (12.42) 
其 中 ,afEL) 是 一 个 次 数 为 ptao =1) 的 滞后 多 项 式 ,c(L) 是 一 个 次 数 为 9- 1 HERAA, 


-附录 12.4 ARMA 模型 - 


自 回归 一 移动 平均 模型 { auto regressive-moving average model, 简写 为 ARMA) 通过 
将 u, 建立 为 序列 相关 模型 ,具体 来 说 是 将 建立 为 另 一 个 不 可 观测 的 误差 项 的 分 布 滞后 
(或 “移动 平均 ” ) 模 型 ,从 而 推广 了 自 回 归 模 型 。 也 就 是 说 ,用 附录 12.3 的 滞后 算 子 符号 表 
示 , 设 让 = 名 LDL)e, 其 中 心 是 一 个 序列 无 关 的 不 可 观测 的 随机 变量 ,而 &L) 是 一 个 名 =1 、 次 
数 为 g 的 滞后 多 项 式 。 那 么 ,ARMAIP,2) 模 型 为 : 

e(L)Y, =A +b(L)e, (12.43) 

其 中 ,afL) 是 一 个 m = 工 .次 数 为 器 的 滞后 款项 式 。 

AR 和 ARMA 模型 都 可 被 看 做 是 近似 得 出 Y, 自 协 方差 的 方法 ,其 原因 存 于 ,任何 具有 
有 限 方差 的 平稳 时 间 序列 只 ,都 可 被 写成 一 个 带 有 序列 无 关 误 差 项 的 AR 或 MA ,尽管 AR 
或 MA 模型 可 能 需要 含有 无 穷 阶 数 。 第 二 个 结果 ,一 个 平稳 过 程 可 被 写成 移动 平均 的 形式 ， 
就 是 著名 的 沃 尔 德 (Wold) 分 解 理论 , 它 是 支撑 平稳 时 间 序 列 分 析 理 论 的 基本 绪论 之 一 。 

理论 上 ,只 要 满 后 多 项 式 有 足够 高 的 阶 数 ,AR,MA 和 ARMA 模型 族 便 具有 相同 丰富 的 
意义 。 在 某 些 情况 下 ,用 含有 较 小 的 p 和 9g 的 ARMA(P,9) 模 型 近似 替代 自 协 方差 , 比 仅 用 
少数 涡 后 项 的 纯粹 的 AR 模型 要 好 。 然 而 实际 上 ,ARMA 模型 的 估计 要 比 AR 模型 的 估计 
更 困难 ,而 且 ARMA 模型 比 AR 模型 更 难 被 扩展 到 包含 额外 的 回归 因子 。 


[附录 12.5 _BIC 滞后 长 度 估计 量 的 一 致 性 ] 


本 附录 概述 了 " 自 回归 模型 中 潍 后 长 虚 的 BIC iha p 在 大 样本 条 件 下 是 正确 的 "这 
一 论述 , 即 Pr(p =p) 一 1 ,但 这 不 适合 AIC 估计 量 , 它 高 估 了 ,即使 在 大 样本 条 件 下 。 


BIC 

首先 考虑 特殊 的 情形 . 即 当真 实 的 滞后 长 度 为 1 时 ,在 含有 零 阶 ,一 阶 或 二 阶 滑 后 的 自 
回归 模型 中 用 BIC 选择 阶 数 。 下 面 证 明 :( i) Pr(b=0)—0,( ii )Pr(p =2)-0, 由 此 得 出 
Pr =p) 一 1。 将 这 个 论证 推广 到 0<p 志 pw 内 进行 搜索 的 一 般 情形 时 ,需要 证 明 Pr(p <p) 
—0 H Pr(p >p)—0, 证明 这 些 论证 的 方法 与 下 面 用 来 证 明 ( i ) 和 (站) 所 使 用 的 方法 是 相 
同 的 。 

证 明 ( i ) 和 和 ( H) 

证 明 ( i )。 雪 选择 p=0, 必 须 满足 条 件 BIC(0) < BIC(1), 即 BIC(0) -BIC(1) <0, 
现在 BIC(0) - BIC( 1) = iln[ SSR(0)ZT] + (InT)zT| ~ {ln[ SSR(1)ZT] + 2{InT}/T! = 
In[ SSR(O)AT] ~In[ SSRC1)AT] - (mT)/T, WA SSR(O)ZT = [(T-1)ZT] $ +o， 
SSR()ZT— e , (Ip) T 一- 必 。 那 么 将 这 两 部 分 合并 起 来 ,就 有 BIC(0) -BIC(1) 一 二 


Ino? - ing? >0, 因 为 0o+ >o:?。 由 此 得 出 ,Pr[ BIC(0) <BIC(1)] 一 0, 所 以 Pr(p =0)—0, 
EIH jj )o BEHE p =2 ,必须 满足 条 件 BIC(2) < BIC{1) 或 BIC(2) -BIC(1) <0, B 














然 了 了 [BICY2) - BIC(1)] =T 1[]I (SSR(2)/T) +3(InT)/AT] - [I Ip ( SSR(1)ZT) + 
2(InT)/T]1 = Tinf SSRC2)/SSR(L) I + nT = - Tn[1 +F/(T-2)] +InT, 其 中 ,F = [SSR 
(1) -SSR(2) /LSSR(2)/(T -2) 1 是 检验 AR(2) 中 B=0 这 一 零 假设 的 “经 验 规则 ”正统 
计 基 ( 见 附 录 5.3)。 如 果 &, 是 同方 差 的 ,那么 下 服从 渐 近 的 Xi 分布; 否则, 它 服从 某 个 其 他 
形式 的 渐 近 分 布 。 因 而 ,Prl BIC(2) -BIC{1) <0] =Pr| TIBIC(2) — BIC(I)] <0i =Pri - 
Tin[ 1 +F/(T-2)] + (In7) <0] =PriThn[1+F/A(T-2)1>iIn7T]。 随 着 了 的 增加 ,Tln[1+ 
F/(T-2)] ~-E 0( 它 是 对 数 近 似 hn(1 +a) =a 的 一 个 结果 , 当 a—0 时 变 得 更 精确 )。 因 
于 ,Pr[ BIC(2) — BIC(1) <0]—Pr( F >] aT) —0 ,这 样 便 有 Pr(p =2) 一 0。 


AIC 


EARD 的 特殊 情况 下 , 当 只 考虑 零 阶 .一 阶 或 二 阶 汪 后 时 ,将 ( i ) 应 用 于 AIC ,其 中 
用 2 RE bT, LA Pr(p =0)—0 。 将 证 明 BIC{ 让) 中 的 全 部 步骤 也 应 用 于 AlC ,并 用 
2 代替 nT 做 一 下 修正 ,因而 ,Pr[ AIC(2) -AIC(1) <0]—Pr( F >2) >0。 如 果 是 同方 差 
HIRA PriF >2)—>Priyi >2) =0.16, 这 样 Pr(p =2)—0. 16, 一般 地 说 , 当 用 AIC 选择 p 
时 ,Pr(P<p) 一 0, 但 Pr(p >p) 趋 向 于 某 个 正 数 ,所 以 ,Pr(p =p) 不 会 趋向 于 1。 


s 13. 


动态 因果 效应 的 
估计 A 





在 1983 年 的 电影 {交易 场 》 中 ,由 Dan Aykroyd 和 Eddie Murphy 扮演 的 演员 利用 佛 罗 里 村 
州 栓 子 如 何 安全 地 度 过 骞 名 的 内 部 信息 在 浓缩 裙 汁 期 货 市 场 ( 即 以 一 定 的 价格 大 量 买卖 在 未 
来 时 期 执行 的 浓缩 杠 汗 合约 的 市 场 } 上 获取 了 上 百 万 美元 的 暴利 。 在 现实 生活 中 , 检 汗 期 货 的 
交易 者 殉 实 密切 关注 佛罗里达 州 的 天 气 ,佛罗里达 州 的 霜 淋 头 死 了 佛罗里达 州 的 机 子 , 而 这 些 
棋子 几乎 是 美国 制造 冷 六 浓缩 权 汁 的 全 部 原料 ,因此 查 汁 的 供给 下 降 , 价 格 上 涨 。 但 当 佛 罗 里 
达州 天 气 和 恶化 时 ,价格 确切 地 上 涨 多 少 ? 价格 是 立刻 上 涨 ,还 是 会 延期 ? 如果 是 延期 的 话 ,会 
延期 多 久 ? 和 这些 问 题 都 是 那些 在 柱 汗 期 货 中 的 实际 交易 者 要 想 取 得 上 成功 必须 回答 的 。 

本 章 研究 下 在 现在 和 未 来 的 变化 对 了 的 效应 的 估计 问题 , 即 天 的 变化 对 了 的 动态 因果 效应 
(dynamic casual effect)。 例 如 ,佛罗里达 州 猫 冻 期 间 对 橙 秆 价格 随时 间 变 化 的 路 径 的 效应 是 什 
2? 建 模 和 估计 动态 因果 效应 的 出 发 点 就 是 所 谓 的 分 布 灌 后 回归 模型 ,其 中 ,了 被 表示 为 站 的 
当前 值 及 过 去 值 的 函数 。13.1 节 通 过 引入 随时 间 变 化 的 佛罗里达 州 寒冷 天 气 对 浓缩 禄 汁 价格 的 
效应 的 例子 ,介绍 了 分 布 涪 后 模型 。13.2 节 进 一 步 考察 了 动态 因果 效应 的 精确 含义 。 

估计 动态 因果 歼 应 的 一 种 方法 ,就 是 用 OLS 估计 分 布 滞后 问 归 模型 的 系数 。 如 13.3 节 中 所 
论述 的 ,给 定夺 的 当前 慎 和 过 去 值 ( 一 个 被 称 为 外 生性 的 条 件 , 见 第 10 章 ) ,如 果 回 归 误 差 项 有 条 
忻 零 均 慎 ,那么 这 个 居 计 量 就 是 一 致 的 。 由 于 被 语 汤 的 那些 决定 了 的 因素 随时 间 的 变化 而 相关 
( 踊 由 于 它们 是 序列 相关 的 ), 因 此 ,分 布 滞后 模型 中 的 误差 项 可 能 是 序列 相关 的 。 这 种 可 能 性 反 
而 需要 一 个 新 的 标准 误 的 公式 , 妈 “ 异 方差 一 自 相 关 一 一 到 性 ”( HAC ) (heteroskedasticity-and 
autocorrelation-consistent ) 标准 误 公 式 , 这 是 13.4 节 要 讨论 的 问题 。 

另 一 种 舍 计 动态 因果 效应 的 方法 (在 13.5 节 中 论述 ), 是 将 误差 项 中 的 序列 相关 建 禄 
为 一 个 自 回 归 宰 型 ,然后 用 达 个 自 回 归 炎 型 去 推 于 自 回归 分 布 滞后 (ADL) 模 型 。 另外 ,可 
用 广 涉 最 小 二 来 (GLS) 居 计 初 始 的 分 布 滞后 模型 的 系数 。 不 过 ,ADL 和 GIS 方法 要 求 一 种 
比 选 今 为 止 我 们 所 用 的 方法 更 强 的 外 生性 形式 : 严 外 生性 。 在 严 并 生性 条 件 下 ,给 定 下 的 








过 去 .现在 和 未 来 值 ,回归 误差 项 的 条 件 均 慎 为 堆 。 

13.6 节 提 供 了 对 杠 汁 价 裙 和 天 气 之 间 关 系 的 更 全 面 的 分 析 。 在 这 个 应 用 中 ,天 气 超 出 
了 人 人力 控制 的 范围 ,因而 是 外 生 的 [尽管 如 13.6 节 所 述 ,经 济 理论 认为 它 不 一 定 是 严 外 生 
的 ) 。 自 于 外 生性 是 估计 动态 因果 效应 的 必要 条 件 ,因此 ,13.7 节 用 几 个 取 自 宏观 经 济 学 和 
金融 学 中 的 例子 研究 了 这 个 假设 。 

本 章 建 立 在 12.1 节 到 12.4 节 内 容 的 基础 之 上 ,但 除了 13,6 节 的 实证 分 析 部 分 外 ,不 
需要 12.5 节 和 到 12.8 节 的 内 容 。 


3 1 对 橙汁 数 据 的 初步 考察 


奥兰多 ,佛罗里达 州 橙子 种 植 区 的 中 心 ,在 正常 情况 下 是 晴朗 和 温 萎 的 ,但 价 尔 会 有 寒 
潮 。 如 果 气 温 下 降 到 冰点 以 下 太 久 ,那么 许多 杜 子 会 从 树 上 掉 下 来 ,而 且 如 果 霜 冻 严 重 的 
话 ,橙子 树 也 会 受 床 。 在 霜冻 之 后 ,浓缩 橙汁 的 供给 下 降 ,价格 上 涨 ,但 价格 上 涨 的 时 机 是 相 
当 复 洒 的 。 浓 缩 杜 汁 是 “耐用 的 ”或 可 储藏 的 商品 , 即 它 可 以 在 冻结 状态 下 储藏 ,尽管 要 花 
费 一 定 的 成 本 ( 运转 冷冻 设备 ) 。 因 而 ,浓缩 橙汁 的 价格 不 仅 取决 于 当前 的 供给 ,还 依赖 于 
对 未 来 供给 的 预期 。 今 天 的 霜冻 意味 着 未 来 浓缩 橙汁 的 供给 会 下 降 ,但 由 于 可 以 使 用 现 有 
的 浪 缩 橙汁 来 满足 现在 或 未 来 的 需求 ,因此 现 有 浓缩 粮 守 的 价格 现在 就 会 上 瀛 。 但 是 , 当 发 
ERT ,浓缩 橙汁 的 价格 确切 地 上 涨 多 少 ? 这 个 问题 的 答案 不 仅 楼 计 交 易 者 感 兴趣 ,更 一 
般 地 说 ,研究 现代 商品 市 场 运 行 的 经 济 学 家 们 也 感 兴趣 。 要 和 弄 清楚 橙 守 的 价格 是 如 何 对 天 
气 的 变化 做 出 反应 的 ,我 们 必须 分 析 橙 守 价 格 和 天 气 的 数据 。 

从 1950 年 1 月 到 2000 # 12 月 的 冷冻 浓缩 票 计价 格 的 月 度数 据 ,及 其 月 度 百分比 变化 
和 佛罗里达 州 楼 子 种 植 区 的 气温 变化 ,绘制 在 图 13 一 ! 中。 图 13 一 1(a) 中 所 绘制 的 价格 是 
批发 离 所 支付 的 冷冻 浓缩 楼 汁 的 实际 平均 价格 。 这 个 价格 用 产 成 品 的 整体 生产 者 价格 指数 
进行 了 缩减 ,以 剔除 整体 价格 水 平 通货 膨胀 的 影响 。 绘 制 在 图 13. 1(by 中 的 价格 百分比 变 
化 是 橙汁 在 月 度 间 价格 的 变化 。 绘 制 在 图 13 一 1(e) 中 的 气温 数据 是 在 佛罗里达 州 的 奥 兰 
多 机 场 测 量 的 “冷冻 温度 日 "(freezing degree days) 数 ,用 在 某 月 份 给 定 日 期 里 华氏 最 低 气温 
低 于 冰点 的 度数 之 和 来 计算 。 例 如 ,在 1950 年 11 月 ,机 场 气温 两 次 降 到 冰点 以 下 ,在 25 日 
(31°) 8129 日 (29*) 共 计 4 个 冷冻 温度 日 ((32 -31) + (32 -29))( 该 数据 在 附录 13. 1 中 
被 更 为 详细 地 描述 ) 。 通 过 比较 图 13 一 ! 中 的 图 形 可 以 看 到 ,浓缩 枪 守 的 价格 波动 很 大 ,其 
中 一 部 分 波动 看 起 来 与 佛罗里达 州 的 寒冷 天 气 有 关 。 

我 们 现在 开始 分 析 橙 汁 价格 和 天 气 之 间 的 定量 关系 ,使 用 天 气 变 冷 时 对 楼 汁 价格 上 涨 
量 有 影响 的 回归 模型 。 因 变量 是 该 月 期 间 橙汁 价格 的 百分比 变化 ( 驰 ChsP ,这 里 免 CREP， 
=100 x Aln (p”), p” 是 橙 六 的 实际 价格 ) 。 回 归 因 子 是 那个 月 份 里 的 冷冻 温度 只 数 
(FDD,)。 使 用 1950 年 1 月 到 2000 年 12 月 的 月 度数 据 估计 这 个 回归 方程 (本 章 中 的 所 有 
回归 都 用 一 样 的 数据 ) ,共计 了 =612 个 观测 值 。 


s 
% ChgP, = 





-0.40 + 0.47 FDD, (13.1) 
(0.22) (0.13) 


本 节 所 报告 的 标准 误 不 是 通常 的 OLS 标准 误 ,而 是 适合 于 当 误 差 项 和 回归 因子 都 自 相 
关 时 的 蜡 方 差 一 自 相关 一 一 致 性 (HAC) 标准 误 。HAC 标准 误 在 13.4 节 中 讨论 ,这 里 只 是 
使 用 ,没有 给 出 进一步 的 解释 。 

根据 这 个 回归 ,在 某 个 月 份 , 多 一 个 冷冻 温度 日 会 使 该 月 份 浓缩 标 计 的 价格 上 逢 
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(e) 佛罗里达 州 奥兰多 的 月 度 冷 冻 齐 度 日 
E :冷冻 浓 缩 橙 计 的 价格 在 各 月 之 间 一 直 存 在 报 大 的 波动 。 许 多 大 的 省 动 与 橙子 种 植 园 的 故乡 质 
兰 多 的 霜冻 天 气 一 致 。 
图 13 一 1 ” 酸 汁 的 价格 与 折 罗 里 达州 的 天 气 {11950 一 2000 年 】 

0.47%. EE 4 个 冷冻 温度 时 的 月 份 里 ,如 1950 年 11 月 ,相对 于 没有 抵 于 冰点 日 子 的 月 份 
而 言 ,估计 被 缩 橙 并 的 价格 会 增加 1.88 久 (4 x0.47% ) ç 

由 于 公式 人 13. 1) 中 的 回归 只 包括 对 同期 天 气 的 测度 , 因此 , 它 设 有 捕捉 到 寒潮 对 下 一 
月 份 橙 并 价格 任何 延续 的 影响 。 为 了 捕捉 这 些 延 续 的 影响 ,我 们 需要 考虑 FDD 的 同期 值 及 
其 滞后 值 对 价格 的 影响 ,这 可 以 通过 扩展 公式 (13, 1) 中 的 回归 来 实现 ,例如 ,用 FDD 在 前 6 
个 月 里 的 请 后 值 。 


— 

%ChgP,- -0.65 + 0.47 FDD + 0.14 FDD, + 0.06 
(0.23) (0.14) (0.08) (0. 06) 
+ 0.03 FDD ,+ 0.05 FDD..,+ 0.05 FDD， (13.2) 
(0.03) (0.03) (0.04) 


FDD,., + 0.07 FDD, 
(0.05) 


公式 (13.2) 就 是 一 个 分 布 清 后 回归 。 公 式 (13.2) 中 7DD 的 系数 估计 了 在 厢 洪 发 生 的 
月 份 里 价格 的 百分比 增加 , 窗 一 个 冷冻 温度 日 估计 会 使 该 月 份 的 价格 增加 0.47%, FDD, 
一 阶 滞后 FDD, ,的 系数 估计 了 由 上 个 月 的 冷冻 温度 日 所 引起 的 价格 的 百分比 增加 。 二 阶 
滞后 系数 估计 了 两 个 月 以 前 冷冻 温床 日 的 影响 , 依 此 类 推 。 或 者 说 ,PPDD 的 一 阶 滞后 系数 
估计 了 在 霜冻 发 生 后 的 一 个 月 里 FDD 增加 1 单位 的 影响 。 因 此 ,公式 (13.2) 中 的 估计 系数 
是 FDD, 增加 1 单位 对 % ChP, 的 当前 值 和 未 来 值 产生 影响 的 估计 值 ,也 就 是 说 ,它们 是 
FDD, Xt% ChgP, 动态 因果 效应 的 估计 值 。 例 如 , 据 佑 计 ,1950 年 11 月 的 4 个 冷冻 温度 日 已 
使 1950 年 11 月 份 期 间 橙 守 的 价格 增加 了 1.88% ,在 1950 年 12 月 再 额外 增加 0.56% (4 x 
0.14% ) ,在 1951 年 1 月 再 额外 增加 0. 24% (4 <0. 06% ) ,等 等 。 








13.2_ 动态 因果 效应 - 


在 学 习 更 多 的 估计 动态 因果 效应 的 工具 之 前 ,我 们 应 该 花 一 些 时 间 来 考虑 动态 因果 效 
应 的 精确 含义 是 什么 。 清 楚 地 理解 动态 因果 效应 的 含义 有 助 于 更 清楚 地 理解 它 能 够 被 估计 
出 来 的 条 件 。 


13.2.1 因果 效应 和 时 间 序 列 数据 


1. 2 节 将 因果 效应 定义 为 一 个 理想 的 随机 化 控制 实验 的 结果 。 当 一 位 园艺 家 随机 地 向 
一 些 西 红 柿 地 块 而 不 是 其 他 的 西红柿 地 块 施肥 ,然后 测量 产量 ,在 施肥 的 和 未 施肥 的 地 块 之 
间 产 量 的 预期 差 就 是 施肥 对 西红柿 产量 的 效应 。 不 过 ,这 个 实验 概念 是 一 个 有 多 个 主体 
(多 个 西红柿 地 块 或 多 个 人 ) 的 概念 ,因此 数据 要 么 是 截面 的 (在 收获 结束 时 西红柿 的 产 
B) ,要 么 是 面板 数据 (在 一 个 实验 性 的 工作 培训 项 目前 后 个 人 的 收入 }。 由 于 有 多 个 主体 ， 
因此 既 有 处 理 组 ,也 有 控制 组 ,进而 就 可 以 估计 处 理 的 因果 效应 了 。 

在 时 间 序 列 应 用 中 ,这 个 根据 理想 的 随机 化 控制 实验 定义 的 因果 效应 需要 修正 ,具体 来 
讲 , 就 是 考虑 宏观 经 济 中 的 一 个 重要 问题 ;估计 一 个 不 可 预测 的 短期 利率 的 变化 对 给 定 国 家 
当前 和 未 来 经 济 行为 的 影响 ,经 济 行为 用 CDP 测度 。 照 字面 意思 理解 ,根据 1.2 节 的 随机 
化 控制 实验 ,我 们 必须 将 不 同 的 经 济 总 体 随 机 地 分 配 到 处 理 组 和 控制 组 。 处 理 组 中 的 中 央 
银行 会 使 用 随机 利率 变化 这 个 处 理 , 而 控制 组 中 的 中 央 银 行 不 使 用 这 个 随机 变化 的 处 理 . 
对 这 两 个 组 而 言 ,经 济 活 动 (例如 GDP) 将 在 接 下 来 的 几 年 里 被 测量 ,但 如 果 我 们 对 估计 特 
定 国家 ( 比如 说 ,美国 ) 的 这 种 效应 感 兴趣 ,那么 我 们 应 该 怎样 做 呢 ? 于 是 ,这 个 实验 会 要 求 
作为 主体 的 美国 有 不 同 的 "“ 复 本 ”, 并 将 一 些 复 本 分 配 到 处 理 组 ,将 另 一 些 复 本 分 配 到 控制 
Ha BR ,这 个 “并 行 总 体 " 的 实验 是 不 可 行 的 。 

相反 ,在 时 间 序 列 数 据 中 ,所 考虑 的 随机 化 控制 实验 是 由 相同 的 主体 (比如 说 ,美国 经 济 ) 
在 不 同 的 时 点 (20 世纪 70 年 伐 .80 年 代 等 等 ) 被 给 予 不 同 的 处 理 ( 随机 选择 的 利率 的 变化 )。 
在 这 个 框架 下 ,不 同时 期 的 这 个 单个 主体 既 扮 演 处 理 组 的 作用 ,也 扮演 控制 组 的 作用 :有 时 美 
联储 会 改变 利率 ,而 有 时 又 不 会 。 因 为 数据 是 随时 间 搜 和 集 的 ,所 以 使 测度 动态 因果 效应 ( 即 处 
理 对 所 研究 结果 影响 的 时 间 路 径 ) 成 为 可 能 ， 例如 ,短期 利率 意外 增加 2 个 百分点 , 且 维 持 了 
一 个 季度 , 它 最 初 对 产 基 的 影响 可 能 是 微乎其微 的 ;在 两 个 季度 以 后 ,GDP 增长 可 能 会 减缓 ,在 
一 到 一 年 半 以 后 减速 最 大 ;而 在 接 下 来 的 两 个 年 度 里 ,CDP 增长 可 能 会 回 到 正常 水 平 上 。 这 个 
因果 效应 的 时 间 路 径 就 是 利率 的 意外 变化 对 CDP 增长 的 动态 因果 效应 。 

作为 第 二 个 例子 ,考虑 冷冻 温度 日 对 橙 计价 格 的 因果 效应 。 可 以 想象 ,有 许多 假设 的 实 
验 , 每 个 实验 得 到 不 团 的 因果 效应 ,这 是 完全 可 能 的 。 其 中 的 第 一 个 实验 是 ,改变 佛罗里达 
州 橙子 林 的 天 气 ,但 保持 其 他 地 方 的 天 气 不 变 , 例 如 ,保持 德 友 萨 斯 州 的 普 萄 园 和 其 他 柑橘 
类 水 果 种 植 区 的 天 气 不 变 。 这 个 实验 在 保持 其 他 地 区 天 气 不 变 的 情况 下 测度 了 一 个 局 部 的 
效应 。 第 二 个 实验 可 以 改变 所 有 地 区 的 天 气 , 在 这 里 “处 理 " 是 整个 天 气 模式 的 应 用 。 如 果 
天 气 在 有 竞争 性 的 作物 种 植 区 之 间 是 相关 的 ,那么 这 两 个 动态 因果 效应 的 结果 就 会 不 同 。 
在 本 章 中 ,我们 考虑 后 一 个 实验 中 的 因果 效应 , 即 应 用 整个 天 气 模式 的 因果 效应 。 这 个 实验 
和 佛罗里达 州 的 因果 效应 的 例子 比较 接近 , 即 在 不 保持 其 他 农业 区 的 天 气 不 变 的 情况 下 , 测 
量 佛罗里达 州 天 气 变 化 对 价格 的 动态 效应 。 

动态 效应 利 分 布 清 万 模型 。 因 为 动态 效应 一 定 是 随时 间 面 发 生 的 ,所 以 ,由 来 值 计 动 态 
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分 布 滞后 系数 构成 了 非 零 动 态 因 果 效 应 的 全 部 内 容 。 我 们 称 这 个 假设 一 一 E(w XXa 
…)】=0 一 一 为 过 去 和 现在 的 外 生性 { past and present exogeneity) ,但 由 于 该 定义 与 第 10 
章 中 的 外 生性 定义 类 似 , 因 此 我 们 只 使 用 术语 外 生性 ( exogeneity) 。 

外 生性 的 第 二 个 概念 是 ,给 定 巨 的 所 有 过 去 值 .现在 值 和 未 来 值 的 条 件 下 ,误差 项 的 均 
EAF, BI E(u lee, Xurs X. Xo Xis X. 2) = 0, 这 被 称 为 严 外 生性 (strict 
exogeneity ) ,为 清楚 起 见 ,我 们 还 称 其 为 过 去 、 现 在 和 未 来 的 外 生性 ( past, present, and 
future exogeneity ) 。 引 人 严 外 生性 概念 的 原因 是 , 当 支 是 严 外 生 的 时 ,存在 比 公 式 (13.3) 
中 的 分 布 滞后 模型 系数 的 OLS 估 计量 更 有 效 的 动态 因 困 效应 系数 的 估计 量 。 

外 和 牛 性 (过 去 和 现在 ) 与 严 外 生性 ( 过去、 现在 和 未 来 之 间 的 差异 在 于 , 严 外 生性 在 条 
FARAHS T AX 的 未 来 值 ,因而 , 严 外 生性 隐 含 针 生 性 ,但 反之 并 不 成 立 。 理 解 这 两 个 概 
念 之 间 差 异 的 一 种 方法 是 ,考虑 和 之 间 相 关 关 系 定义 的 含义 。 如 果 夺 是 (过 去 和 现在 ) 
SMER, IKA u, 5 X, 的 现在 值 和 过 去 值 均 无 关 。 如 果 是 严 外 生 的 ,那么 除 上 述 无 关外 ,u， 
还 与 的 未 来 值 无关 。 例 如 ,如 果 Y 的 变化 引起 无 的 未 来 值 变 化 ,那么 X, 不 是 严 外 生 的 ， 
即使 它 可 能 是 ( 过 去 和 现存 外 生 的 。 

为 了 具体 说 明 , 考 虑 按 公式 (13.3) 所 描述 的 一 个 西红柿 与 肥料 之 间 多 年 关系 的 假设 实 
验 。 因 为 在 该 假设 实验 中 肥料 是 随机 地 施加 的 ,所 以 它 是 外 生 的 。 因 为 现在 的 西红柿 产量 
不 依赖 于 未 来 的 施肥 基 , 所 以 施肥 时 间 序 列 也 是 严 外 生 的 。 

作为 第 二 个 例子 ,考虑 橙 着 价格 的 例子 ,其 中 Y, 是 补 秆 价格 的 月 度 百 分 比 变化 ,大 是 那个 
月 份 中 冷冻 温度 日 数 。 从 橙汁 市 场 角度 来 看 ,我 们 可 以 认为 天 气 一 一 冷 凉 温度 日 数 一 一 仿佛 
是 被 随机 分 配 的 ,因为 天 气 超出 了 人 力 控制 的 范围 。 如 果 FDD 的 效应 是 线性 的 , 它 在 了 个 月 
以 后 对 价格 没有 影响 ,那么 就 可 以 推论 天 气 是 外 生 的 。 但 天 气 是 严 外 生 的 吗 ? 给 定 FDD 的 未 
来 值 ,如 果 un 的 条 件 均值 是 非 零 的 ,那么 本 中 就 不 是 严 外 生 的 。 要 回答 这 个 问题 ,需要 仔 网 考 
J u, 中 确切 地 包含 了 什么 。 龙 其 是 ,如 果 橙 汁 市 场 参与 者 在 决定 以 某 一 给 定价 格 买 卖 多 少 各 
汁 时 使 用 FDD 的 预测 值 ,那么 橙汁 的 价格 以 及 误差 项 u, 就 能 够 体现 未 来 FD 的 信息 , 它 使 得 
u, 成 为 FDD 的 一 个 有 用 预测 因子 。 这 意味 着 ,u, 将 与 FDD, 的 未 来 值 相关 。 根 据 这 个 推理 ， 
由 于 w 包含 了 未 来 佛罗里达 州 天 气 的 预测 ,因此 FDD 会 是 (过 去 和 现在 ) 外 生 的 , 而 不 是 严 外 
生 的 。 这 个 例子 与 西 红 本 和 肥料 的 重子 之 间 的 区 别 是 ,橙汁 市 场 的 参与 者 受 未 来 佛罗里达 州 
天 气 预 测 的 影响 ,而 西红柿 农作物 不 受 末 来 施肥 的 影响 。 在 13.6 节 中 , 当 我 们 更 详细 地 分 析 
橙 计 价格 数据 时 ,我 们 还 会 回 到 FDD 是 否 是 严 外 生 的 问题 上 。 

外 生性 的 两 个 定义 在 重要 概念 13.1 中 总 结 。 





重要 概念 13. 1 
， 分 布 滞后 模型 和 外 生性 
在 分 布 河 后 模型 
Y, =P +Ë, +X, thA.: ter +B, ,-, +u, (13.4) 
中 ,存在 两 个 不 同类 型 的 外 生性 , 即 两 个 不 则 的 外 生性 条 件 。 
过 去 和 现在 外 生性 (外 生性 ) : 
E(u X, ,Xs K...) =0 (13.5) 
过 去 .现在 和 未 来 外 生性 ( 严 外 生 人 性) : 
天 (本 . (13.6) 


如 果 工 是 严 外 生 的 ,那么 它 也 是 外 生 的 ,但 外 生性 并 不 隐 含 着 严 外 生性 。 


-13.3 含有 外 生 回归 因子 的 动态 因果 效应 的 估计 - 


如 果 王 是 外 生 的 ,那么 它 对 了 的 动态 因果 效应 可 以 用 公式 (13.4) 中 分 布 斌 后 模型 的 
OLS 估计 方法 进行 估计 。 本 节 总 结 了 这 些 OLS 估计 量 生成 有 效 统 计 推 断 的 条 件 , 并 所 介绍 
了 动态 磁 数 和 累积 动态 水 数 。 


13.3. 1 分布 滞后 模型 的 假设 


分 布 滞后 模型 稀 四 个 假设 与 截面 多 元 馈 归 模型 的 四 个 假设 类 似 ( 见 重要 概念 5.4) ,对 
时 间 序 列 数据 来 说 再 要 做 一 些 修正 。 

第 一 个 假设 是 ,X 是 外 生 的 , 它 将 截面 数据 的 条 性 零 均值 假设 扩展 到 包含 所 有 洪 后 值 的 
情形 。 如 13. 2 节 中 所 论述 的 ,这 个 假设 意味 着 公式 (13. 3) 中 的 7 个 分 布 滞后 系数 构成 了 非 零 
动态 因果 效应 的 全 部 内 容 。 在 此 意义 上 ,总 体 回 归 函 数 概括 了 X 的 变化 对 了 的 全 部 动态 效应 。 

第 二 个 假设 有 两 个 部 分 :部 分 (a) 要 求 这 些 变量 是 平稳 分 布 的 ,部 分 (b) 要 求 当 分 离 变 
量 的 相隔 时 期 数量 变 大 时 ,这 些 变 量 是 独立 分 布 的 。 这 个 假设 与 ADL 模型 中 的 相应 假设 
(重要 概念 12, 6 中 的 第 二 个 假设 ) 祖 同 ,并 且 在 12. 4 节 中 对 这 个 假设 的 讨论 也 适用 于 这 里 。 

第 三 个 假设 是 ,变量 有 八 阶 以 上 的 非 零 的 和 有 限 的 矩 。 这 个 假设 比 本 书 中 其 他 地 方 所 
用 的 四 阶 有 限 矩 假设 更 强 。 如 13.4 节 中 所 讨论 的 ,这 个 强 假 设 被 用 在 HAC 方差 估计 量 背 
后 的 数学 推导 中 。 

第 四 个 假设 和 截面 数据 多 元 回归 模型 中 的 假设 相同 , 即 不 存在 完全 多 重 共 线 性 。 

分 布 滞后 回归 模型 及 其 假设 在 重要 概念 13.2 中 总 结 。 

扩展 到 额外 的 X 变 里 。 分 布 灌 后 模型 可 直接 扩展 到 多 个 变量 XY, 只 要 把 额外 的 变量 
及 其 滞后 项 作为 回归 因子 从 含 在 分 布 潜 后 模型 中 就 可 以 了 ,而 且 ,为 了 包含 这 些 额 外 的 回归 
因子 ,需要 修改 重要 概念 13. 2 中 的 假设 。 尽 管 扩 展 到 多 个 变量 了 的 情形 从 概念 上 理解 是 直 
接 的 ,但 是 它 的 符号 表示 却 很 复杂 ,让 本 了 分 布 灌 后 模型 估计 和 推断 的 主要 思想 。 因 此 ,本 
章 对 多 个 六 变量 的 情形 没有 给 予 直接 的 处 理 , 只 讨论 了 一 个 简单 的 扩展 , 即 单个 变量 *X 的 
分 布 淋 后 模型 。 


13.3.2 自 相关 的 u, 、 标 准 误 和 推 其 


在 分 布 清 后 模型 中 ,误差 项 u, 可 以 是 自 相关 的 ,也 就 是 说 ,u 可 能 与 它 的 滞后 值 相关 。 
在 时 间 序 列 数据 中 ,出现 这 个 自 相关 的 原因 是 包含 在 z 中 的 那些 遗 滑 负 子 本 身 可 能 是 序列 
相关 的 。 例 如 ,假设 对 橙 计 的 需求 还 依赖 于 收 人 ,那么 影响 栖 汁 价格 的 一 个 因素 就 是 收 和 人 ， 
具体 地 讲 也 就 是 潜在 橙 汗 消费 者 的 总 收入 。 于 是 ,在 橙 守 价格 变化 对 冷冻 温度 日 的 分 布 澡 
后 回归 中 , 冲 收 人 是 一 个 遗 湄 变量。 不 过 ,总 收 人 是 序列 相关 的 :总 收入 在 经 济 衰退 期 倾 癌 
于 下 降 ,而 在 经 济 扩张 期 颁 向 于 上 升 ,因此 ,收入 是 序列 相关 的 ,而 且 因 为 它 是 误差 项 的 一 部 
分 ,所 以 u, 也 是 序列 相关 的 。 这 个 例子 很 典型 ,由 于 Y 的 遗漏 的 决定 性 因素 本 身 是 序列 相 
关 的 ,因此 一 般 来 讲 , 分 布 滞后 模型 中 的 u, 将 是 序列 相关 的 。 

u, 的 自 相关 性 不 会 影响 OLS 的 一 致 性 ,也 不 会 引 人 人 情 差 。 不 过 , 如果 误差 项 是 自 相关 
的 ,那么 一 般 而 言 ,通常 的 OLS 标准 误 就 是 不 一 致 的 ,必须 使 用 不 同 的 公式 。 因 此 ,误差 项 
的 相关 与 异 方差 类 似 , 当 误 差 项 确实 是 异 方差 的 时 , 仅 适用 于 同方 差 的 标准 误 就 是 错误 
的 ” ,因为 当 误差 项 是 异 方差 的 时 ,使 用 仅 适 用 于 同方 差 的 标准 误会 导致 误导 人 性 的 统计 扒 
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断 。 同 样 , 当 误差 项 序列 相关 时 ,根据 独立 同 分 布 的 误差 项 所 预测 的 标准 误 是 错误 的 ,因为 
它们 也 会 导致 误导 性 的 统计 推断 。 这 个 问题 的 解决 方法 是 ,使 用 异 方差 一 自 相 关 一 一 致 性 
( HAC) 标准 误 , 这 大 13.4 节 讨 论 的 内 容 。 


重要 概念 13. 2 


分 布 滞后 模型 的 假设 
分 布 滞后 模型 在 重要 概念 13. 1 中 给 出 (公式 (13.4) ) EP: 
1. X EINER, BI Ele, X, X Xe) =0。 
2. (ea) 随 机 变量 了 AX 有 个 平稳 的 分 布 ;(5) 随 着 j ARAK, (YAX, EA 
变 成 独立 的 。 
3. 革 和 蕊 有 八 阶 和 以 上 的 非 零 的 和 有 限 的 矩 。 
4. 不 存在 完全 多 重 共 线性 。 


13.3.3 动态 乘 数 和 累积 动态 乘 数 


动态 因果 效应 的 另 一 个 名 称 是 动态 乘 数 。 累 积 动态 乘 数 是 直到 某 一 给 定 滞后 期 的 累积 
因果 效应 ,因此 ,累积 动态 乘 数 测量 了 的 变化 对 了 的 累积 效应 。 

动态 乘 数 。 外 的 单位 变化 在 期 以 后 对 了 的 影响 ,也 就 是 公式 (13.4) 中 的 及， ,被 称 为 上 
期 动态 乘 数 (dynamic multiplier) 。 因 此 ,联系 在 和 了 的 动态 滋 数 就 是 公式 (13.4) 中 五 及 其 河 
后 项 的 系数 。 例 如 ,8, 是 1 PIERA 8, 是 2 期 动态 乘 数 , 依 此 类 推 。 在 这 个 术语 中 ,0 期 
(或 同期 } 动 态 乘 数 ,或 叫 冲 击 效应 (impact effect) 就 是 , 它 是 X 在 同期 的 变化 对 了 的 影响 。 

由 于 动态 乘 数 是 用 OLS 回归 系数 估计 的 ,因此 ,它们 的 标准 误 就 是 GLS 回归 系数 的 
HAC 标准 误 。 

ZBA., h BREDA RH cumulative dynamic multiplier) ,是 在 接 下 来 的 也 
期 里 节 的 单位 变化 对 了 的 累积 效应 。 因 而 ,累积 动态 乘 数 是 动态 沫 数 的 累积 和 。 根 据 公 式 
(13.4) 中 分 布 滞后 模型 的 系数 ,0 期 累积 乘 数 是 8, ,1 期 累积 乘 数 是 5, +B, ,h 期 的 累积 动态 
REE B +B, +… +B;,1。 所 有 单个 动态 乘 数 的 和 B+B, +… +B, EE X WATA Y R 
积 长 期 效应 , 称 为 长 期 黑 积 动态 乘 数 (Iong-run cumulative dynamic multiplier) 。 

例如 , 考 虚 公式 (13.2) 中 的 加 归 。 增 加 一 个 冷冻 温度 日 的 钥 时 效应 ,是 浓缩 检讨 的 价 
格 上 涨 0.47 铝 。 一 个 价格 变化 在 下 个 月 果 的 累积 效应 ,等 于 冲击 效 庶 与 未 来 一 个 月 动态 效 
应 的 和 , 因此 , 价格 的 累积 效应 是 初始 增 量 0.47% 加 上 随后 较 小 的 增 旱 0.14 免 ,共计 
0, 6 站。 同样 ,未 来 两 个 月 的 系 积 动态 梁 数 等 于 0. 47% +0, 149 +0. 06% = 0.67%, 

累积 动态 乘 数 可 以 直接 用 公式 (13.4) 中 分 布 滞后 模型 的 履 正 形式 进行 估计 ,这 个 修正 
的 回归 是 : 

Y=6 +8ñ AX, +6 A 1 BAX, a +u AX, ss +ô, AX... +u, (13.7) 

公式 (13.7) 中 的 系数 8 8... ,65,,1 实 际 上 就 是 累积 动态 乘 数 。 这 可 以 用 一 点 代数 知 
识 来 证 明 ( 见 练习 13.5) , 它 证 明了 公式 (13.7) 和 公式 (13.4) 中 的 总 体 回归 是 等 价 的 ,其 中 
A = 有 ,5 = 有 ,5 = 有 + 及 ,5 =B, +B, +B, RERE, X. ,的 系数 ,1 是 长 期 动态 累积 条 
3k BB. =, +B. +B, +u +B, 此 外 ,公式 (13.7) 中 系数 的 OLS 估计 量 与 公式 (13.4) 
中 OLS 估计 量 对 应 的 累积 和 相同 。 例 如 ,名 =, + 应 。 用 公式 (13.7) 中 的 设 定 估计 累积 动 
态 乘 数 的 主要 好 处 在 于 ,因为 回归 系数 的 OL 估计 量 是 累积 动态 乘 数 的 估计 量 , 所 以 ,公式 


(13.7) 中 系数 的 HAC 标准 误 是 累积 动态 乘 数 的 HAC 标准 误 。 


13.4 _ 异 方差 一 自 相关 一 一 致 性 标准 误 - 


如 果 误 差 项 w 是 自 相关 的 ,那么 OLS 是 一 致 的 ,但 一 般 来 讲 , 通 常 截面 数据 OLS 的 标准 误 
并 不 是 一 致 的 。 这 意味 着 ,以 通常 的 OLS 标准 误 为 基础 的 常规 的 统计 推断 一 一 假设 检验 和 置 
信 区 间 一 一 一 般 来 讲 会 产生 误导 。 例 如 ,由 OLS 估计 量 +1.96 售 常 规 的 标准 误 所 构造 的 置信 
区 间 在 5% 的 重复 样本 中 不 一 定 会 包含 真实 值 ,即使 样本 规模 很 大 。 本 节 首 先 推导 含有 自 相 
关 误 差 的 OLS 估计 量 方差 的 正确 表达 式 , 然 后 转向 蜡 方 差 一 自 相 关 一 一 致 性 标准 误 的 讨论 。 


13.4.1 误差 项 含有 自 相 关 的 OLS 估计 量 的 分 布 


为 了 使 问题 简单 化 ,在 一 个 无 渐 后 项 的 分 布 滞后 回归 模型 中 ,考虑 OLS 估计 量 房 , Bl & 
有 单个 回归 因子 X, 的 一 个 线性 回归 模型 ; 
Y, =A, +B, +u, {13.8) 
这 里 满足 重要 概念 13. 2 的 假设 。 本 节 证 明 高 的 方差 可 被 表示 成 两 项 之 积 :在 4 不 是 序列 
相关 的 情况 下 适用 的 varl ) 的 表达 式 , 乘 以 一 个 修正 因子 。 这 个 修正 因子 是 因 的 自 相 
关 , 或 更 精确 地 讲 , 是 因 (X, - u, )u, 中 的 自 相关 而 产生 的 。 
如 附录 4.3 中 所 证 明 的 ,重要 概念 4.2 中 OLS 估计 重 房 的 公式 可 被 重 写 为 ， 





Ê, =B. + (13.9) 


其 中 ,公式 (13.9) 就 是 公式 (4. 51) ,符号 有 所 改变 ,原来 的 Ft n 3: 和 了 所 代替 。 由 于 
X— u B+ Y. (站 一 司 ? 一 of 因此 ,在 大 样本 条 件 下 , 房 - B, 可 近似 地 由 下 式 表 示 ; 





Ê -p = (13.10) 
x 


了 
其 中 心 = ( X, -jiyi HP = Ye ;因此 : 
va 局) =v E) = (13.11) 

WE o 是 独立 同 分 布 的 ,如 在 重要 报 念 4. 3 中 对 截面 数据 所 做 的 假设 ,那么 var( s) = 
var(y,)/T, 重 要 概念 4.4 F ñ, 的 方差 表达 式 就 是 适用 的 。 不 过 ,如 果 随 着 时 间 的 推移 ,wm 和 
X, 不 是 独立 分 布 的 ,那么 一 般 来 讲 , 将 会 是 序列 相关 的 ,因此 ,重要 概念 4.4 中 3 方差 的 表 
达 式 就 不 适用 了 。 相 反 ,如 果 w 是 序列 相关 的 ,那么 5 的 方差 可 以 表示 如 下 : 

var) = var[ (o; +o + +err) T] 

=[var(s,) +cov(ə sth) +" +eov(u tr) + Covtts o) + varv, ) +`" +var( vy) JT 


=[Tvac(u,) +2CT -1)eovts, ,1) +T -2)covlv na) +“: +2eovlo st ra) T 
=f {13. 12) 





其 中 








了 -1 . 
f, =1 +25 (Eb, (13.13) 


RẸ p, = corfu, v) ,在 大 样本 条 件 下 ,所 趋向 于 极限 ,fy 一 f。= 1 +25p, a 

` s, 是 自 相关 的 时 ,将 公式 (13. 10) rB Añ, 的 表达 式 和 公式 (13. 12) 中 var(v) 的 表达 式 
侣 并 起 来 ,得 到 启 的 方差 表达 式 。 

var(ĝ,) = l+ J (13.14) 

HP f, 在 公式 {13,13) 中 给 出 。 

公式 (13. 14) 将 记 的 方差 表示 为 两 项 之 积 。 方 括号 中 第 一 项 是 重要 概念 4.4 中 给 出 的 
B, 的 方差 表达 式 , 它 适用 于 不 存在 序列 相关 的 情形 。 第 二 项 是 因子 万, 它 是 调整 序列 相关 
的 一 个 表 法 式 。 由 于 公式 (13. 14) 中 这 个 额外 的 因子 斤 , 如 果 误 差 项 是 序列 相关 的 ,那么 用 


重要 概念 4.4 中 的 公式 计算 的 OLS 标准 误 就 不 正确 ,更 确切 地 讲 , 如 果 = (XX, 一 jx )u 是 
序列 相关 的 ,那么 由 于 因子 记 的 原因 , 方 莹 估计 量 就 会 是 不 准确 的 。 


13.4.2 HAC 标准 误 


如 果 公式 (13. 13) 中 定义 的 因子 万 是 已 知 的 ,那么 启 的 方差 可 以 用 通常 的 截面 数据 方 
差 估 计量 乘 以 广 来 估计 。 不 过 ,这 个 因子 依赖 于 v 这 个 未 知 的 自 相关 关系 ,因此 必须 估计 
ÈE. 不论 是 省 存在 异 方差 ,不 论 v, 是 否 是 自 相 关 的 ,加 和 人 这 种 调整 的 房 的 方差 估计 量 都 是 
一 致 的 。 因 此 ,这 个 估计 量 被 称 为 房 方差 的 异 方差 一 自 相关 一 一 致 性 {heteroskedasticity- 
and autocorrelation-consistent ,简写 为 HAC) 估 计量 ,HAC 方差 估计 若 的 平方 根 是 启 的 
HAC 标准 误 {HAC standard error), 

HAC y Kik X, B, 方差 的 异 方差 一 自 相关 一 一 致 性 估计 量 症 : 

= => f (13.15) 

其 中 ,六 是 不 存在 序列 相关 时 公式 (4. 19) 中 给 出 的 房 的 方差 估计 基 念 是 公式 (13. 13) 中 
因子 .ff 的 估计 量 。 

构造 一 致 性 佑 计量 六 的 工作 是 富有 挑战 性 的 。 为 什么 ? 我 们 考虑 两 种 极端 的 情况 。 
一 种 极端 情况 ,很 据 公式 (13. 13) 中 的 公式 ,用 样本 自 相关 系数 p (公式 (12.6) 中 所 定义 的 ) 


代替 总 体 自 相关 系数 看 上 去 似乎 是 很 自然 的 ,得 到 估计 量 1 + 2 y (p wñ 


计量 包含 了 许多 估计 的 自 相关 ,所 以 它 是 不 一 臻 的。 直观 上 讲 , 由 于 每 个 所 估计 的 自 相关 系 
数 都 包含 估计 误差 ,因此 ,通过 估计 如 此 多 的 自 相关 系数 ,即使 在 大 样本 条 件 下 ,这 个 户 信 
计量 中 的 估计 误差 仍旧 会 很 大 。 另 一 种 极端 情况 ,人 们 可 以 设想 只 使 用 儿 阶 样本 自 相关 的 
情形 ,比如 说 只 使 用 一 阶 样本 自 相关 ,而 乱 略 所 有 的 更 高 阶 自 相关 。 虽 然 这 个 估计 量 排除 了 
估计 太 多 自 相关 系数 的 呆 烦 问题 ,但 是 它 又 有 了 另 一 个 不 同 的 问题 , 它 是 不 一 致 的 ,因为 它 
忽略 了 出 现在 公式 (13. 13) 中 的 额外 自 相关 。 简 而 言 之 ,使 用 太 多 的 样本 自 相关 会 使 估计 
二 有 很 大 的 方差 ,但 使 用 太 少 的 自 相 关 会 忽 路 高 阶 的 自 相关 。 因 此 ,在任 一 种 极端 情况 中 ， 
这 个 估计 量 都 是 不 一 致 的 。 

实际 中 所 使 用 的 方 的 估计 量 , 需 要 在 这 两 个 极端 情况 之 间 做 出 平衡 ,选择 多 少 阶 的 自 


相关 被 包 笑 进 米 ,取决 于 样本 规模 7。 如 果 样 本 规模 较 小 ,那么 只 使 用 少数 自 相 关 , 但 如 果 
样本 规模 较 大 ,那么 应 包括 更 多 的 自 相关 (但 仍旧 远 小 于 7 了 7) 。 其 体 地 讲 , 设 记 由 下 式 给 出 ; 


-125 (=o (13.16) 
了 = 上 


其 中 ,P = 之 hh > E, = (一 下 区 (如 在 饥 的 定义 中 那样 )。 会 式 (13. 16) 中 的 参数 


m HPK HAC 佑 计量 的 截断 参数 (truncation parameter ) ,因为 自 相 关 的 和 被 缩短 为 或 被 截 
断 为 只 包含 m -1 阶 自 相关 ,代替 出 现在 公式 (13, 13) 的 总 体 表 达 式 中 的 了 -1 阶 自 相关 。 

要 使 方 是 一 致 的 ,就 必须 选择 m, 使 它 在 大 样本 条 件 下 很 大 ,尽管 仍 比 了 小 很 多 。 实 际 

中 选择 m 的 一 个 指导 原则 是 使 用 公式 (13. 17) ,四 全 五 人 到 整数 。 

m=0. 757° (13.17) 
这 个 公式 是 建立 在 这 个 假定 之 上 的 , 即 中 有 中 度 的 自 相 关 的 重 , 它 给 出 了 确定 m(m 作为 
回归 中 观测 期 数 的 一 个 函数 } 的 一 个 基本 准则 中 。 

由 公式 (13. 17) 所 得 到 的 截断 参数 m 的 值 ,可 以 根据 你 所 掌握 的 有 关 该 序列 的 知识 进 
行 修正 。 一 方面 ,如 果 % 中 存在 大 其 的 序列 相关 ,那么 就 要 增 大 mw 超出 公式 (13. 17) 中 所 给 
的 值 。 另 一 方面 ,如 果 v, 中 存在 很 少量 的 自 相关 ,那么 你 可 以 减 小 m。 由 于 m 的 选择 存在 
歧 关 ,因此 一 个 比较 好 的 实用 方法 是 ,对 一 个 设 定 至 少 尝 试 一 个 或 两 个 可 供 选 择 的 m 值 , 确 
信和 所 得 的 结果 对 m 不 敏感 为 止 。 

公式 {13. 15) 中 的 HAC Hh A, 由 公式 (13.16) 给 出 ,该 HAC 佑 计量 被 称 为 纽 韦 一 韦 
斯 特 方差 佑 计量 | Newey-West variance estimator) ,以 提出 庐 估计 量 的 经 济 计 量 学 家 White 
Newey 与 Kenneth West 来 命名 。 他 们 证 明了 了 , 当 与 公式 (13. 17) 中 那样 的 规则 一 起 使 用 时 ,在 
通常 的 假设 下 ,这 个 估计 量 是 房 的 方差 的 一 个 一 致 估计 量 ( Newey 与 West,1987) 。 他 们 的 证 
骨 ( 以 及 Andrews( 1991 ) 中 的 证 明 》 假 设 wm 有 四 阶 以 上 的 矩 ,这 反而 又 隐 合 在 下 lu, 有 八 阶 以 
土 的 类 中 ,这 就 是 重要 概念 13. 2 中 的 第 三 个 假设 为 和 M u, 有 从 阶 以 上 的 矩 的 原因 。 

其 他 HAC 估计 其。 纽 书 一 韦 斯 特 方差 佑 计量 并 不 是 惟一 的 HAC 估计 量 。 例 如 ,公式 
(13.16) 中 的 权重 (m - 门 Zm 可 被 不 同 的 权重 代 苦 。 如 果 使 用 另 一 个 不 同 的 权重 ,那么 公式 
(13. 17) 中 选择 截断 参数 的 规则 就 不 再 适用 ,应 该 使 用 由 这 些 权重 所 引申 出 来 的 不 同 的 规 
则 。 使 用 其 他 权重 对 HAC 估计 量 的 进一步 讨论 超出 了 本 书 的 范围 ,要 了 解 有 关 这 个 主题 的 
更 多 信息 ,请 见 Hayashi(2000,6.6 节 )。 

扩展 到 多 二 回 I。 本 节 中 所 讨论 的 全 部 问题 可 推广 到 重要 概念 13. | RS 8 5 Wi 
项 的 分 布 滞后 模型 ,更 一 般 地 说 ,可 推广 到 含有 序列 相关 的 误差 项 的 多 元 回归 模型 。 尤 其 
是 ,如 果 误 差 项 是 序列 相关 的 ,那么 通常 的 OLS 标准 误 就 是 统计 推断 的 一 个 不 可 靠 的 基础 ， 
应 该 用 HAC 标准 误 代 替 。 如 果 所 用 的 HAC 方差 估计 量 是 纽 韦 一 万 斯 特 估 计量 (基于 权重 
(m-j)/m 的 HAC 方差 佑 计量 ) ,那么 不 论 回归 中 存在 单个 回归 因子 还 是 多 个 回归 因子 ,都 
可 以 按照 公式 (13. 17) 中 的 规则 选择 截断 参数 m。 多 元 回归 中 HAC 标准 误 的 表达 式 已 被 褒 
入 到 时 间 序 列 数据 分 析 的 现代 回归 软件 中 。 出 于 这 个 表达 式 涉及 矩阵 代数 ,因此 这 里 省 略 
了 它 。 数 学 细节 ,读者 可 参考 Hayashi( 2000 ,6. 6 T). 





Qy MU u Fü X, 是 一 阶 自 相关 系数 为 0.5 的 一 阶 白 相关 过 程 ,那么 方程 (13. I7) 给 出 了 严 的 "最 优 选择, 这 里 的 
“BE ERARE ETIE EGA -0h )* 最 小 。 方 程 (13. 17) 是 以 Andrews{ 1991 ,方程 (5. 3) ) 推导 出 的 一 个 更 一 般 的 
公式 为 基础 的 。 








HAC 标准 误 在 重要 概念 13. 3 中 总 结 。 


重要 概念 13. 3 


HAC 标准 误 

问题 ;在 重要 概念 13. 1 中 ,分布 滞 后 回归 模型 中 的 误差 项 & 可 能 是 序列 相关 的 。 如 果 
是 这 样 的 话 ,那么 OLS 系数 佑 计量 是 一 致 的 ,但 一 般 来 讲 , 通 常 的 OLS 标准 误 则 不 是 一 臻 
的 , 它 会 导致 误导 性 的 假设 检验 和 和 曾 信 区 间 。 

解决 方法 : 标准 误 应 该 用 该 方差 的 异 方差 一 自 相 关 一 一 致 性 (HAC) 的 估计 量 来 计算 。 
HAC 估计 量 涉 及 m -1 个 自 协 方差 及 方差 的 人 知 计 值 。 在 单个 回归 因子 的 情况 下 ,相关 表达 
式 在 公式 {13, 15) 和 公式 (13. 16) 中 给 出 。 

在 实 虐 中 ,使 用 HAC 标准 误 需 要 选择 截断 参数 m ,为 此 , 需 使 用 公式 {13. 17) 中 的 表达 
式 作 为 一 个 基准 ,然后 根据 回归 因子 和 误差 项 有 较 大 或 较 小 的 序列 相关 来 增 大 或 碱 小 m。 


13.5 含有 严 外 生 回 归 因 子 时 动态 因果 效应 的 估计 


3 X, 是 严 外 生 的 时 ,可 以 有 两 个 可 供 选 择 的 动态 因果 效应 估计 量 。 第 一 个 这 样 的 估计 
量 , 涉 及 属 计 一 个 自 回 归 分 布 河 后 (ADL) 模 型 ,而 不 是 分 布 滞 后 模型 ,并 依据 所 信 计 的 ADL 系 
数 计算 动态 乘 数 。 这 种 方法 要 求 估计 的 系数 比分 布 滞后 模型 的 OLS 估计 的 系数 少 ,因而 潜在 
地 降低 了 估计 误 差 。 第 -种 方法 是 ,使 用 广义 最 小 二 乘 {generalzed least squares ,简写 为 
GLS) 法 而 不 是 OLS 法 估计 分 布 滞后 模型 的 系数 。 尽 管 在 分 布 滞 后 模型 由 ,用 GLS 法 所 估计 
的 系数 个 数 和 用 OLS 法 所 估计 的 系数 个 数 一 样 ,但 是 GLS 估计 量具 有 更 小 的 方差 。 为 了 使 说 
明 简 单 , 先 列 出 这 丙种 估计 方法 ,并 在 含有 单个 灌 后 项 和 AR(1) 误 其 的 分 布 滞后 模型 的 条 件 
下 进行 讨论 。 不 过 , 当 有 许多 滞后 项 出 现在 分 布 王 后 模型 由 时 ,这 两 个 估计 量 的 潜在 优势 最 
大 ,因此 ,这 些 佑 计量 就 可 以 推广 到 含有 更 高 阶 自 回 归 误 差 的 广义 分 布 滞后 模型 。 


13.5.1 食 AR(1) 误 差 项 的 分 布 滞后 模型 


很 设 工 的 变化 对 了 的 因果 效应 只 持续 两 期 , 即 它 含 有 初始 时 的 冲击 效应 记 和 下 一 期 效 
应 6, ,但 不 存在 随后 的 效应 ,那么 合适 的 分 布 滞后 模型 就 是 只 含有 半 -, 的 当前 值 和 过 去 值 
的 那个 分 布 放 后 模型 。 





Y=B tX, +B,X,., +u, (13.18) 
如 13.2 节 所 论述 的 ,一 般 地 说 ,公式 {13. 18) 中 的 误差 项 u, 是 序列 相关 的 。 这 个 序列 
相关 的 一 个 后 果 是 ,如 果 用 OLS 估计 这 些 分 布 滞后 系数 ,那么 基于 通常 的 OLS 标准 误 的 统 
计 推 断 可 能 是 误导 性 的 。 正 是 这 个 原因 ,13.3 节 和 13.4 节 强 调 了 当 用 0LS 估计 公式 
(13. 18) 中 的 B 和 应 时 应 当 使 用 HAC 标准 误 。 
在 本 节 , 我 们 采取 一 种 不 同 的 方法 来 分 析 u, 的 序列 相关 。 这 种 方法 (在 蕊 是 严 外 生 的 
情况 下 是 可 行 的 ) 涉及 采用 自 回归 模型 分 析 m 中 的 序列 相关 ,还 涉及 在 分 布 滞后 模型 中 使 
用 这 个 AR 模型 推导 出 一 些 可 能 OL 合计 量 更 有 效 的 估计 量 。 


具体 来 说 ,假设 六 满足 AR(1) 模 型 。 
u =u, +Ë, (13.19) 


其 中 ,由 E B E| 3. z 是 序列 无 关 的 ,而 且 这 里 不 需要 截 虹 项 , 因为 E(w,) =0。 公 式 
(13. 18) 和 公式 (13. 19) 意味 着 含有 序列 相关 误差 项 的 这 个 分 布 滞后 模型 可 被 重 写 为 含有 





13.5.3 GES 估计 


HA, EERON), ithe 3 Sk 835 E E LR GLS), g ys 
MRAR. 23)。 为 了 描述 GTS iE RARR p 是 已 知 的 。 因 为 在 实践 
中 它 是 未 知 的 ,这 个 估计 量 是 不 可 行 的 ,所 以 被 称 为 不 可 行 的 GLS 估计 量 。 不 过 ,可 用 p, 
的 估计 量 修正 这 个 不 可 行 的 GLS 估计 重 ,得 到 一 个 可 行 的 GLS 估计 量 。 


Kufiri CLS. B p, 是 已 知 的 ,那么 准 差 分 变量 站 和 了 可 以 直接 地 计算 。 正 如 在 


ARO. 24) 和 公式 (13. 26) 的 上 下 文中 所 讨论 的 ,如 果 所 ESE BREZ ECL IX X... 
"y =0, RE, WE X, EIER, E d, 是 已 知 的 ,那么 公式 (13. 23) 中 的 系数 m B, 和 所 


就 可 用 立 w? X, 和 总 ,的 OLS 回归 (包含 截 距 项 ) 来 估计 ,相应 所 得 的 B Ae 的 估计 量 
一 一 即 在 $, 已 知 时 ,公式 (13.23) 中 斜率 系数 的 OLS 佑 计量 一 “是 不 可 行 的 GLS 估计 量 


(infeasible GLS estimator) 。 这 个 估计 量 之 所 以 不 可 行 , 是 因为 由, 是 未 知 的 ,因此 ,证 和 六 
计算 不 出 来 ,进而 实际 中 这 些 0LS 估计 量 也 不 能 计算 。 

可 行 的 CLS。 可 行 的 GLS 估计 量 (feasible GLS estimator) 是 通过 用 由 的 一 个 初始 全 
计量 多 ,以 计算 所 估计 的 准 差分 ,来 修正 不 可 行 的 CLS 估计 量 得 到 的 。 具 体 地 讲 ,B, Ti B, 
的 可 行 的 GLS 估计 量 就 是 公式 (13. 23) 中 系数 B 和 局 的 OLS 估计 量 , 用 多 对 名 和 名 ,的 
回归 ( 含 截 距 项 ) 来 计算 ,这 里 这 =X -$X =Y, - d Yl. 

初始 估计 量 钊 , 可 以 这 样 来 计算 :首先 用 OLS 估计 公式 (13. 18) 中 的 分 布 滞后 模型 , 然 
后 使 用 OLS 舍 计 公式 (13. 19) 中 的 ,其 中 以 OLS RE h 代 震 不 可 观测 的 回归 误差 u。 该 
GLS 估计 量 的 这 种 形式 ,被 称 为 柯 赫 伦 一 奥 克 特 ( Cochrane - Orcutt) (1949) 估 计量 。 

柯 赫 伦 一 奥 克 特 方法 的 一 个 扩展 方法 就 是 不 断 重复 这 个 过 程 ;用 8, Ti 8, 的 GLS 估计 
EHA u, 的 修正 的 估计 量 ; 用 这 些 新 的 残 差 重新 估计 由 ;用 这 个 修正 的 由 估计 量 计算 修正 
的 所 估计 的 准 差分 ;用 这 些 修正 的 所 估计 的 准 差分 重新 估计 B 和 ;继续 这 个 过 程 ,直到 
Bi fl p, 的 癸 计 量 收 敏 为止。 这 个 估计 量 被 称 为 选 代 的 柯 赫 伦 一 奥 克 特 估计 量 。 

GLS 估计 量 的 非 线性 最 小 二 称 解 释 。 对 CLS 佑 计量 的 一 个 等 价 的 解释 是 ,在 对 公式 
(13. 22) 强加 了 参数 约束 的 情况 下 , 它 估计 了 公式 (13, 21) 中 的 ADLAN, REARED 
始 参数 B,,B,,B, 和 由 的 非 线性 函数 ,所 以 不 能 用 OLS 执行 这 个 估计 ,相反 ,可 以 使 用 非 线 
性 最 小 二 乘法 (NLLS) 来 估计 这 些 参数 。 如 9. 3 节 中 所 论述 的 ,NLLS 可 使 所 估计 的 由 同 归 
函数 所 造成 的 误差 平方 和 达到 最 小 ,进而 可 以 认识 到 该 回归 函数 是 所 估计 的 参数 的 一 个 非 
线性 函数 。 一 般 来 说 ,为 了 最 小 化 未 知 参 数 的 非 线性 函数 ,NLLS 估计 可 能 需要 复杂 的 算法 。 
不 过 在 我 们 目前 特殊 的 例子 中 ,不 需要 那些 复杂 的 算法 ,而 是 可 以 用 上 文 所 描述 的 选 代 的 柯 
蔡伦 一 奥 克 特 估计 量 的 算法 计算 NLS 估计 量 。 因 此 ,这 个 选 代 的 柯 赫 伦 一 奥 克 特 估计 量 
实际 上 是 在 公式 (13. 22) 中 的 非 线 性 约束 条 件 下 ADL 系数 的 NULS 佑 计量 。 

CLS 有 效 性 。GLS 估计 量 的 优点 在 于 , 当 X 是 严 外 生 的 且 变 换 后 的 误差 总 是 同方 差 的 
时 , 它 在 线性 估计 量 中 是 有 效 的 合计 量 ,至少 在 大 样本 条 件 下 。 要 理解 这 一 点 ,首先 考虑 不 


可 行 的 CLS EH, WE Q 是 同方 闫 的 ,4 是 已 知 的 (因此 总 和 站 可 以 像 它们 被 观测 到 
的 那样 来 处 理 ) A, 是 严 外 生 的 ,那么 高 斯 一 马尔 可 夫 定 理 隐 含 着 ,公式 (13.23) 中 am,B, 和 














B 的 OLS 估计 量 在 爹 部 线性 条 件 无 偏 估 计量 中 是 有 效 的 ,也 就 是 说 ,公式 (13. 23) 中 系数 的 
OLS 估计 量 是 最 优 线性 无 偏 估计 量 或 BLUE( 见 4.9 节 ) 。 由 于 公式 (13. 23) 中 的 OLS 估计 
其 是 不 可 行 的 GLS 估计 量 , 因 此 ,这 意味 着 该 不 可 行 的 GLS 估计 量 是 BLUE 的 。 可 行 的 那 
个 GLS 估计 最 与 不 可 行 的 GLS 估计 量 类 似 ,不 同 的 是 由 被 估计 了 。 由 于 由 的 估计 量 是 一 
致 的 , 它 的 方差 与 T 成 反比 ,所 以 在 大 样本 条 件 下 这 些 可 行 的 各 不 可 行 的 GLS 估计 量具 有 
相同 的 方差。 在 这 个 意义 上 ,如 果 天 是 严 外 生 的 ,那么 这 个 可 行 的 GLS 估计 量 在 大 样本 条 
件 下 就 是 BLUE 的 。 尤 其 是 ,如 果 下 是 严 外 生 的 ,那么 GLS H 13.3 节 中 所 论述 的 那个 分 布 
滞后 模型 的 0LS 估计 量 更 有 效 。 

这 里 所 给 出 的 柯 赫 伦 一 奥 克 特 估计 量 和 迭代 的 柯 替 伦 一 奥 克 特 估计 芋 是 GLS 估计 的 
特例 。 一 般 地 说 ,GLS 估计 涉及 变换 回归 模型 ,使 得 误差 项 是 同方 差 的 各 序列 无 关 的 ,然后 
用 OLS 估计 变换 后 的 模型 的 系数 。 如 果 著 是 严 外 生 的 ,那么 其 GLS 估计 量 就 是 一 致 的 ,并 
HÆ BLUE 的 ,但 如 果 于 只 是 (过 去 和 现在 ?外 生 的 ,这 个 结论 则 不 成 立 。CILS 的 数学 推导 
涉及 矩阵 代数 ,所 以 将 它们 延迟 到 16.6 节 。 


13.5.4 ”含有 额外 灌 后 项 和 AR(p) 误差 项 的 分 布 滞后 模型 


前 面 对 公式 (13. 18) 和 公式 (13. 19 PAA X, 的 单个 滞后 项 和 AR(1) 的 误差 项 的 分 布 
滞后 模型 的 讨论 ,也 适用 于 会 有 多 个 沾 后 项 和 AR(p) 误 差 项 的 广义 分 布 灌 后 模型 的 情形 。 
含有 日 问 睛 误差 项 的 广 文 分 布 滞后 模型 。 含 有 阶 滞后 和 AR{P) 误 差 项 的 广义 分 布 清 
后 模型 为 : 
Y, =f +B, X, +BA tee +B (13.30) 
= (13.31) 
HPB. 8. EARR T 由 ,…, 中 , 是 误差 项 的 自 回归 系数 。 对 于 误差 项 的 AR(p) 
模型 G, 是 序列 无 关 的 。 
导出 公式 (13, 21) 中 ADL 模型 的 代数 运算 表明 ,公式 (13. 30) 和 公式 (13. 31) 隐 含 着 可 
用 ADL 形式 将 Y, 写 为 ; 
Y, =u th Y,a + + + + + (13.32) 
其 中 ,9 =r+p E iei, 是 公式 (13.30) 和 公式 (13.31) 中 系数 8 和 中 的 函数 。 公 式 
(13.30) 和 公式 (13. 31) 中 的 模型 可 用 准 差 分 形式 等 价 地 写成 : 


f, =a, +8,2, + Bi, EET. EE AES (13.33) 
其 中 , =Y, - b Y, — "°° -四 工交 = 一 中 -Xpo . 
ADL 系数 估计 的 茶 件 。 前 面 在 AR(1) 情 况 下 对 ADL 系数 一 致 性 估计 条 件 的 讨论 ,可 
推广 到 含有 AR(p) 误 差 的 一 般 模型 中 。 公 式 (13. 33) 中 的 条 忻 零 均值 假设 是 指 : 


EYI, e) =0 (13.34) 
H+ i, =h, -ġiti 一 机- -中 is X, =X, -h41 一 -由 于 -这 个 条 件 等 价 于 : 
E( uA, Ai a) -ġ E( H; IX, ,省 -1 peoe -QE tp lA, ,有 1) =0 (13.35) 


为 使 公式 (13. 35) 对 全 部 的 四 ,… ,中 , 值 都 成 立 , 必 有 公式 (13. 35 ) 中 的 每 一 个 条 件 其 


望都 为 零 ,或 者 说 , 必 有 下 述 条 件 成 立 : 
可 (和 =Ü (13. 36) 


这 个 条 件 不 能 被 不 是 (过 去 和 现在 ) 外 生 的 这 个 条 件 所 隐 会 ,但 却 可 以 被 无 是 严 外 生 


的 这 个 条 件 所 隐 含 。 实 际 上 ,在 极 服 意义 下 , 当 p 无 穷 大 时 (因此 分 布 灌 后 模型 中 的 误差 项 
满足 无 穷 阶 的 自 回归 ) ,公式 (13. 36) 中 的 条 件 变 为 重要 概念 13. 1 中 的 严 外 生性 的 条 件 。 

HOLS 生计 DI 人 榨 弄 。 正 像 在 含有 单个 滞后 项 和 ARG 误差 项 的 分 布 滞后 模型 中 一 
样 ,可 以 根据 公式 (13. 32) 中 ADL 系数 的 OLS 佑 计量 估计 动态 乘 数 。 其 一 般 的 表达 式 与 公 
式 (13. 29) 中 的 表达 式 类 似 ,但 更 复杂 一 些 , 最 好 用 洁 后 乘 数 符 号 表示 ,这 些 表达 式 在 附录 
13. 2 中 给 出 。 实 际 上 ,现代 的 时 间 序 列 回 归 分析 软 件 会 自动 地 为 你 做 这 些 计算 。 

用 GIS 米 仙 计 。 另 一 方面 ,动态 乘 数 可 以 用 (可 行 的 ) GIS 来 舍 计 。 这 需要 对 公式 
(1.33) 中 准 差分 设 定 的 系数 的 OLS 知 计 使 用 所 千 计 的 淮 差分 ,和 AR(1) 中 的 情况 一 样 ,可 
使 用 自 回 归 系 数 由 ,… ,四 , 的 初始 佑 计量 计算 所 估计 的 准 差分 。 根 据 前 面 对 AR(1) 情 况 的 
讨论 ,我 们 说 该 GLS 估计 量 是 渐 近 BIUE 的 。 

在 严 外 生 条 件 下 ,动态 莱 数 的 估计 在 重要 概念 13.4 中 总 结 。 

PRAE Sfidi: OLS ihal GIS? 对 ADL 系数 的 OLS 估计 和 分 布 滞后 系数 的 GLS 佑 
计 , 这 两 种 估计 选择 各 有 优点 ,也 各 有 缺点 。 

与 分 布 河 后 模型 的 OLS 估计 相 比 ,ADE 方法 的 优点 在 于 它 能 够 减少 估计 动态 乘 数 所 需 
要 的 参数 个 数 。 例 如 ,公式 (13, 27)} 中 所 个 计 的 ADL 模型 导出 公式 {13. 29) 中 那个 无 限 长 
的 所 估计 的 分 布 滞 后 代表 式 。 只 含有 ?+ 阶 浪 后 的 分 布 灌 后 模型 实际 上 是 一 个 更 长 阶 灌 后 的 
分 布 滞后 模型 的 一 个 近似 ,从 这 个 意义 上 说 ,ADL 模型 可 以 提供 一 种 只 用 少数 未 知 参数 去 
估计 那些 阶 数 很 长 的 滞后 项 的 简单 方法 。 因 此 在 实际 中 ,用 比 估计 公式 113. 37) 中 分 布 灌 
后 系数 的 OLS 佑 计 所 需要 的 ~ 值 小 得 多 的 P 值 和 4? 值 ,去 佑 计 会 式 (13, 39) 中 的 ADL 模型 ， 
这 是 可 能 的 。 换 名 话说 ,ADL 设 定 能 够 对 一 个 长 且 复杂 的 分 布 滞后 模型 提供 一 个 简洁 的 或 
节俭 的 概括 ( 进一步 的 讨论 请 见 附录 13.2). 





重要 概念 13. 4 
严 外 生 条 件 下 动态 乖 数 的 估计 
RA r 阶 滞后 和 AR(p) 误 差 项 的 广义 分 布 滞后 模型 为 : 
Y, =Ë +B,X, +B,X, + +B,. X, + (13.37) 
u =u, tu, t. tu, + (13.38) 
WR X, 是 产 外 生 的 ,那么 可 以 通过 首先 使 用 OLS 方法 估计 ADL 模型 
= (13. 39) 


的 系数 ,进而 估计 动态 乘 数 B ，…, 忆 ,这 里 ,9 =r+p; 然 后 使 用 回归 软件 计算 动态 飞 数 。 
或 者 ,可 用 GLS 估计 公式 (13. 37) 中 的 分 布 洁 后 系数 来 估计 动态 乘 数 。 

GLS 估计 量 的 优点 是 ,对 于 在 分 布 滞后 模型 中 给 定 的 一 个 澡 后 长 度 r 而 言 ,这 些 分 布 洪 
后 系数 的 GLS 佑 计量 比 OLS 估计 量 更 有 效 , 至 少 在 大 样本 条 件 下 是 如 此 。 不 过 在 实际 中 ， 
由 于 ADL 模型 设 定 允许 比 GLS 估计 的 参数 少 ,所 以 ADL 方法 还 是 有 优点 的 。 


[13.6_ 橙汁 价格 与 寒冷 天 气 - 


本 节 用 时 间 序 列 回 归 的 工具 ,对 佛罗里达 州 的 气温 和 橙汁 价格 的 数据 做 进一步 深信 的 
分 析 。 第 一 ,一 次 霜冻 对 栓 秆 价 格 的 影响 会 持续 多 久 ? 第 二 ,在 数据 所 跨越 的 51 年 里 ,这 个 
动态 效应 一 直 稳 定 吗 ? 还 是 已 发 生 了 变化 ?如果 变 化 了 , 它 又 是 如 何 变 化 的 ? 











我 们 首先 使 用 13. 3 节 中 的 方法 来 估计 动态 因果 效应 作为 我 们 分 析 的 开始 , 即 用 价格 的 
自分 比 宣化 (名 ChgP,) 对 该 月 冷冻 温度 日 (FDD,) 及 其 滞后 香 回 归 的 这 个 分 布 滞后 回归 系 
数 采 用 OLS 进行 和 估计。 为 了 使 这 个 分 布 滞后 估计 基 是 一 致 的 ,FDD 必须 是 (过 去 和 现在 ) 
外 和 后 的 。 如 13.2 节 中 所 讨论 的 ,这 个 假设 在 这 里 是 合理 的 。 人 类 不 能 影响 天 气 , 因 此 在 实 
验 中 我 们 将 天 气 看 做 是 仿佛 被 随 禄 分 配 的 应 该 是 合适 的 。 由 于 FDD 是 外 生 的 ,我 们 可 用 重 
要 概念 13. ] 中 公式 (13. 4) 的 分 布 滞后 模型 系数 的 OLS 估计 来 估计 这 个 动态 因果 将 应 。 

如 13.3 节 和 13.4 节 中 所 论述 的 ,分 布 滞后 回归 中 的 误差 项 可 能 是 序列 相关 的 ,因此 非 
常 有 必要 使 用 HAC 标准 误 ,因为 它 对 序列 相关 进行 了 调整 。 纽 书 一 韦 斯 特 标准 误 的 截断 参 
数 (13.4 节 的 符号 中 的 m) 的 初始 结果 ,是 用 公式 (13. 17) 中 的 规则 进行 选择 的 .因为 有 
612 个 月 度 观 测 值 ,根据 那个 规则 ,m=0.757T”=0.75 x612 =6.37 ,而 且 , 因 为 中 必须 是 
整数 ,所 以 将 它 向 上 进 到 m=7。 下 面 研 究 标 准 误 对 截断 参数 选择 的 敏感 性 。 

% ChgP, 对 FDD, FDD, EDD as 的 分 布 滞后 回归 的 OLS 估计 结果 总 结 在 表 13 一 1 
的 第 (1) 列 中 。 这 个 加 归 的 系数 { 表 中 内 报告 了 一 部 分 ) 是 ,在 某 月 中 冷冻 温度 日 的 数量 增 
加 1 单位 对 接 下 来 的 18 个 月 橙 汗 价 格 变 化 (以 百分数 表示 ) 的 动态 因果 效应 的 估计 值 。 例 
如 ,在 冷冻 温度 日 发 生 的 那个 月 份 里 ,增加 一 个 冷 凉 温度 日 估计 会 使 价格 增加 0.50%。 一 
个 冷冻 温度 日 在 随后 的 月 份 里 对 价格 的 后 继 效 应 变 小 了 :在 1 个 月 以 后 ,这 个 估计 的 效应 是 
使 价格 进一步 增加 .17 免 ;而 2 个 月 以 后 ,所 估计 的 效应 是 使 价格 再 增加 .07 铝 。 这 个 回 
H R 为 0. 12, 这 表明 橙汁 价格 中 的 大 部 分 变 差 没 有 被 FDD 的 当前 值 和 过 去 值 所 解释 。 

表 13 一 1 FARER (FDD) 对 播 汁 价 次 变化 的 动态 效应 ， 

所 估计 的 部 分 动态 非 数 和 黑 积 动态 先 数 
(1) (2) (3) (4) 
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HAC 标准 误 7 7 14 

注 : 利 用 (在 附录 13. 1 中 所 描述 的 }1950 年 1 月 到 2000 年 12 月 的 月 度数 据 , 共 计 了 =612 个 观测 值 ， 
用 OLS 法 估计 所 有 的 回归 。 因 变量 是 橙 计 价格 的 睛 度 百分比 变化 (各 CgP,)。 回 归 (1 是 分 布 滞后 回归 ， 
其 中 含有 冷 傈 温度 日 的 月 度数 量 及 其 18 BPO TB. EB FDD, FDD  FDD,_ , ,所 报告 的 系数 是 动态 乘 
数 的 OLS 估计 值 。 累 积 乘 数 是 所 估计 的 动态 匀 数 的 累积 和 。 所 有 的 回归 都 包含 截 距 项 ,这 星 没 有 给 出 。 
用 最 后 - 行 给 出 的 截断 数 计 算 的 纽 韦 一 圳 斯 特 HAC 标准 误 在 括号 中 给 出 。 





与 表 13 一 1 这 样 的 表格 相 比 ,动态 乘 数 图 可 能 会 更 有 效 地 传递 信息 。 表 13 一 1 第 (i) 
列 中 的 动态 乘 数 连同 它们 的 95 久 的 置信 区 间 ( 用 所 估计 的 系数 +1.6 倍 HAC 标准 误 计 算 ) 
一 起 被 绘制 在 图 13 一 2(a) 中 。 在 最 初 的 价格 暴涨 之 后 ,随后 的 价格 上 涨 较 小 ,尽管 价格 在 
箱 漆 之 后 的 前 6 个 月 中 据 佑 计 每 个 月 里 会 有 稍 徽 上 涨 。 由 图 13 一 2(a) 可见 ,除了 第 一 个 月 
以 外 ,动态 乘 数 在 5% 的 显著 性 水 平 下 在 统计 上 都 不 是 显著 她 异 于 0 的 ,尽管 直到 第 七 个 月 
它们 还 被 估计 是 正 的 。 

表 13 一 ! 的 第 (2) 列 包 售 了 这 个 设 定 的 累积 动态 乘 数 , 即 第 (1) 列 中 所 报告 的 动态 乘 数 
的 累积 和 。 这 些 动态 乘 数 连同 它们 的 号 免 的 置信 区 间 一 起 被 绘制 在 图 13 一 2(b) 中 。 在 1 
个 月 以 后 ,冷冻 温度 日 的 累积 效应 使 价格 增加 了 0. 好 名 ;在 2 个 月 以 后 ,价格 被 估计 出 已 上 
涨 0.74 免 ;而 在 6 个 月 以 后 ,价格 被 估计 出 已 上 涨 0.90 吕 。 由 图 13 一 2(b) 可 见 ,这 些 累积 
RR- ÉW MART 个 月 ,因为 前 7 个 月 的 单个 动态 乘 数 都 是 正 的 。 在 第 8 个 月 里 ,动态 乘 
数 是 负 的 ,因此 补 守 的 价格 开始 从 它 的 峰值 缓慢 下 降 。18 个 月 后 , 价 烙 的 累积 增加 仅 为 
0.379 ,也 就 是 说 ,这 个 长 期 的 昧 积 动态 乘 数 只 有 0.37 免 。 这 个 长 期 的 累积 动态 科 数 在 
10 名 的 显著 性 水 平 下 在 统计 上 不 是 显著 地 异 于 0 的 (4=0.3770.30 =1. 23), 

彼 感 全 分 析 。 像 在 任何 实证 分 析 中 一 样 ,检查 这 些 结果 对 该 实证 分 析 网 节 的 变化 是 否 
敏感 ,是 非常 重要 的 。 因 此 ,我 们 研究 这 个 分 析 的 三 个 方面 ;对 HAC 标准 误 计算 的 敏感 性 ; 
为 分 析 潜 在 遗漏 变量 偏差 而 提供 的 另 一 种 设 定 的 敏感 性 ;所 估计 的 乘 数 随时 间 变 化 的 稳定 
性 分 析 。 

首先 ,我 们 研究 表 13 一 1 的 第 (2) 列 中 所 报告 的 标准 误 对 HAC 截断 参数 m 的 不 同 选择 
是 理 敏 感 。 在 第 (3) 列 中 ,报告 了 m=14 一 一 是 第 (2) 列 中 所 用 值 的 两 倍 一 一 的 计算 结果 。 
该 回归 设 定 与 第 (2) 列 相同 ,因此 所 估计 的 系数 和 动态 磁 数 是 相等 的 ,只 有 标准 误 不 同 , 但 
碰巧 差异 不 大 。 我 们 的 结论 是 :所 得 结果 对 HAC 截断 参数 的 变化 不 敏感 。 

其 次 ,我 们 研究 遗漏 变量 偏差 的 一 个 可 能 来 源 。 佛 罗 里 达州 的 霜冻 在 整个 一 年 里 并 不 
是 被 随机 分 配 的 ,而 是 ( 当然 ) 发 生 在 符 季 。 如 果 对 答 汁 的 需求 是 季节 性 的 (冬季 对 手 汁 的 
需求 是 否 大 于 夏季 ) ,那么 橙汁 需求 的 季节 模式 可 能 与 FDD 相关 ,从 而 导致 遗漏 变量 偏差 。 
已 售 出 的 用 于 榨 楼 汁 的 林子 的 数量 是 内 牛 的 :价格 和 数量 由 供给 和 需求 的 力量 同时 狂 定 。 
因而 ,如 7.2 节 中 所 论述 的 ,把 该 数量 包含 进 来 将 会 导致 联 立 偏差 。 尽 管 如 此 ,需求 中 的 季 
节 成 分 可 以 通过 将 季节 变量 作为 回归 因子 来 捐 近 。 因 此 , 表 13 一 1 第 (4) 列 中 的 设 定 包含 
T 11 个 月 份 的 二 元 变量 ,一 个 表示 该 月 是 否 是 一 月 份 ,一 个 表示 该 月 是 否 是 二 月 份 ,如 此 等 
等 { 和 通常 一 样 ,必须 省 略 一 个 二 元 变量 ,以 防止 与 截 距 项 的 完全 多重 共 线性 }。 这 些 睛 度 
指示 变量 在 10 名 的 显著 性 水 平 下 并 不 是 联合 地 在 统计 上 是 显著 的 (p =0.43) ,所 估计 的 黑 
各 动态 乘 数 在 本 质 上 与 不 包括 月 度 指 标的 设 定 所 得 出 的 累积 动态 乘 数 相 同 。 总 之 ,需求 的 
季节 性 波动 不 是 遗漏 变 量 偏差 的 一 个 重要 来 源 。 

这 些 动态 乘 数 随时 间 变 化 一 直 稳 定 吗 ? 为 了 评价 动态 乘 数 的 稳定 性 ,我 们 需要 检查 
分 布 滞后 回归 的 系数 随时 间 的 变化 是 可 是 稳定 的 。 因 为 我 们 心中 并 没有 一 个 具体 的 罕 变 日 
期 ,所 以 ,我 们 利用 Quandi 似 然 比 (QLR) 统 计量 ( 见 重 要 概念 12.9) 检 验 向 归 系 数 中 的 不 稳 
定性 。 对 主 全 部 系数 都 存在 交互 作用 的 第 (1) 列 的 回归 所 计算 的 QLR 统计 量 ( 具 有 15% # 
SJA HAC 方差 估计 量 ) 的 值 为 9 08, A hE g =20(FDD, 及 其 18 阶 洁 后 项 和 裁 距 项 的 系 
数 )。 表 12 一 5 中 的 1% AEA 2.43, jt, OLR 统计 量 在 1% 的 显著 性 水 平 下 拒 络 零 假 





C 这 个 小 节 中 稳定 性 的 论述 引用 了 12 7 节 的 内 容 , 如 果 没 有 学 习 那 些 内 容 , 那 么 可 以 内 过 这 一 小 节 。 
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的 所 估计 的 累积 动态 乘 数 和 95% 的 置信 和 区间 

注 :所 估计 的 动态 乘 数 表 明 , 逢 冻 会 导致 价格 的 迅速 上 升 。 未 来 价格 和 的 上 丝 比 初始 冲击 小 得 多 。 累 

积 动态 乘 数 表明 ,霜冻 对 橙 守 价 格 水 平 具有 长 期 持续 性 影响 ,价格 在 霜冻 之 后 的 7 个 月 达到 峰值 。 
E MRAR AFD) 对 松 尘 价格 的 动态 效应 

设 。 这 些 QLR 回归 有 和 个 回归 因子 ,这 是 个 很 大 的 数 ; 只 对 六 阶 滞后 重新 计算 (所 以 有 16 

个 回归 因子 ,q =8) ,其 结果 在 1% 的 水 平 下 也 指 绝 竺 假设。 因此,“ 动态 乘 数 是 平稳 的 "假设 

在 1% 的 显著 性 水 平 下 被 托 纵 。 

为 了 搞 清 楚 动态 乘 数 是 怎样 戎 时 间 的 变化 而 变化 的 ,一 种 方法 是 对 样本 的 不 同 部 分 计 
算 动态 乘 数 。 图 13 一 3 绘制 了 对 每 个 子 样本 进行 单独 回归 所 计算 的 前 三 分 之 一 (1950 一 
1966) 样本 .中 间 的 三 分 之 一 (1967 一 1983 ) 样本 和 最 后 的 三 分 之 一 (1984 一 2000) 样本 所 个 
计 的 累积 动态 乘 数 。 这 些 估计 值 显 示 了 一 个 令 人 感 兴趣 并 且 值 得 关注 的 模式 。 在 20 世纪 


50 年 代 和 60 年 代 初 期 ,一 个 冷冻 光度 日 对 价格 有 很 大 的 且 持 久 的 影响 。-- 个 冷冻 温度 日 
对 价 属 变 化 效应 的 程度 在 20 世纪 70 年 代 变 小 了 ,尽管 它 仍 保持 高 度 的 持续 性 。 在 20 世纪 
80 年 代 后 期 和 90 年 代 , 冷 冻 温 度 日 的 短期 效应 与 20 世纪 70 年 代 相 同 , 但 持续 性 变 弱 了 ， 
而 且 基本 上 在 一 年 后 就 消失 了 。 这 些 估 计 值 表明 ,佛罗里达 州 的 霜冻 对 橙汁 价格 的 动态 因 
果 效 应 在 20 世纪 后 半 个 时 期 变 得 更 小 了 ,持续 性 更 弱 了 。 
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注 : 和 霜冻 对 橙汁 价格 的 动态 效应 在 20 世纪 后 半期 发 生 了 显著 的 变化 。 在 1950 年 到 1966 年 期 间 ， 

霜冻 对 价格 的 冲击 比 后 来 人 ,而 且 在 1984 年 到 2000 年 期 间 , 希 冻 影响 的 持续 性 比 以 前 时 期 弱 。 
图 13 一 3 所 估计 的 不 同样 本 期 的 累积 动态 策 数 

ADE 和 GLS 估计 的 估计 值 。 如 13.5 节 中 所 论述 的 ,如 果 分 布 滞后 回归 中 的 误差 项 是 
序列 相关 的 , 且 FDD 是 严 外 生 的 ,那么 ,比分 布 滞后 系数 的 OLS 估计 更 有 效 地 估计 动态 乘 
数 是 可 能 的 。 然 而 ,在 使 用 GLS 估计 量 或 基于 ADL 模型 的 估计 量 之 前 ,我 们 需要 考虑 FD 
是 否 确 实 是 严 外 生 的 。 的 确 , 人 类 不 能 影响 天 气 , 但 这 是 否 就 意味 着 天 气 是 严 外 生 的 呢 ? 给 
E FDD 的 过 去 值 .现在 值 和 未 来 值 ,分 布 滞 后 回归 中 的 误差 项 u, 是 否 有 条 件 零 均值 ? 

表 13 一 1 第 (1) 列 中 的 分 布 滞后 回归 所 对 应 的 总 体 回归 中 的 误差 项 ,是 价格 和 以 过 去 
18 个 月 的 天 气 资料 为 基础 的 总 体 预 测 值 之 差 。 这 个 差 秆 的 产生 可 有 许多 原因 ,其 中 一 个 原 
因 是 交易 者 使 用 了 奥兰多 的 天 气 预测 。 例 如 ,如 果 预 测 到 一 个 特别 寒冷 的 冬季 ,那么 交易 者 
就 会 将 这 个 预测 综合 到 价格 中 ,因此 ,相应 的 价格 就 会 高 出 以 总 体 回归 为 基础 的 预测 值 ,也 
就 是 说 ,误差 项 可 能 是 正 的 。 如 果 这 个 预测 是 正确 的 ,那么 事实 上 未 来 的 天 气 应 是 寒冷 的 。 
因而 ,未 来 的 冷冻 温度 日 将 是 正 的 (了 ,, >0), 而 当前 的 价格 会 异常 地 高 (u >0) ,所 以 
cor( 于 ,1,w) 是 正 的 。 更 简单 地 说 ,虽然 检讨 交易 者 不 能 影响 天 气 ,但 他 们 能 够 预测 天 气 
《而 且 确 实 是 如 此 ){ 见 本 章 一 般 兴 趣 框 ) ,结果 ,价格 与 天 气 回归 中 的 误差 项 同 未 来 的 天 气 
是 相关 的 。 换 名 话说 ,FDD 是 外 生 的 ,但 如 果 这 个 推理 是 正确 的 ,那么 它 就 不 是 严 外 生 的 ， 
GLS 和 ADL 估计 量 也 将 不 会 是 动态 乘 数 的 一 致 估计 量 。 因 此 ,这 些 估 计量 在 这 个 应 用 中 不 
会 被 使 用 。 








相反 ,在 一 个 欧盟 向 美国 的 出 口 对 美国 收 人 的 回归 中 ,将 美国 收 人 看 做 是 外 生 的 观点 不 
太 令 人 信服 ,因为 欧盟 记 民 对 美国 出 口 商 央 的 需求 构成 了 对 美国 出 口 品 总 需求 的 绝 大 部 分 。 
因而 ,美国 对 欧盟 出 口 商 品 需 求 的 下 降 ,会 减少 欧盟 的 收入 ,这 反 过 来 又 会 减少 对 美国 出 口 
商品 的 需求 ,进而 降低 美国 的 收 人 。 由 于 这 些 通过 国际 贸易 建立 的 联系 ,欧盟 对 美国 的 出 口 
和 美国 的 收入 是 联 立 地 决定 的 ,因此 ,在 这 个 回归 中 可 以 证 明美 国 的 收入 不 是 外 生 的 。 这 个 
例子 说 明了 一 个 更 一 般 的 观点 , 即 一 个 变量 是 否 是 外 生 的 取决 于 它 的 内 容 : 在 一 个 解释 澳 大 
利 亚 出 口 的 回归 模型 中 ,美国 的 收 人 看 上 去 是 外 生 的 ,但 在 解释 欧盟 出 口 的 回归 模型 中 却 不 
是 如 此 。 


13.7.2 石油 价格 和 通货 膨胀 


自从 20 世纪 70 年 代 的 石油 价格 上 涨 以 来 ,宏观 经 济 学 家 们 一 直 对 估计 国际 原油 价格 
上 涨 对 美国 通货 膨胀 率 的 动态 效应 感 兴趣 。 因 为 石油 价格 是 在 大 部 分 石油 价格 由 国外 的 石 
油 生 产 国 决定 这 样 的 世界 市 场 中 决定 的 ,所 以 ,起 初 人 们 可 能 会 认为 石油 价格 是 外 生 的 ,但 
石油 价格 和 天 气 不 一 样 :OPEC 成 员 国 从 战略 的 角度 确定 石油 的 产量 ,他 们 考虑 到 了 许多 因 
素 , 包 括 世界 经 济 状况 。 由 于 石油 价格 {或 产量 ) 是 在 对 当前 和 未 来 的 世界 经 济 状况 (包括 
美国 的 通货 器 胀 } 的 评估 基础 上 做 出 的 ,因此 ,在 这 个 意义 上 说 ,石油 价格 是 内 生 的 。 


13.7.3 货币 政策 和 通货 膨胀 


负责 制定 货币 政策 的 中 央 银 行家 需要 知道 货币 政策 对 通货 膨胀 的 效应 。 因 为 货币 政策 
的 主要 工具 是 短期 利率 { “得 利率 " ) ,因此 ,这 意味 着 他 们 党 要 知道 短期 利率 的 变化 对 通货 
膨胀 的 动态 因果 效应 。 尽 管 短 期 利率 由 中 央 银 行 决定 ,但 它 并 不 是 由 中 央 银 行家 随机 地 决 
定 的 (在 一 个 理想 的 随机 化 实验 中 就 是 这 样 ) ,而 是 内 生地 制定 的 :中 央 雏 行 根据 对 当前 和 
未 来 经 济 状况 的 评估 ,特别 是 对 当前 和 未 来 通货 脱 腾 率 的 评估 ,制定 了 短期 利率 。 反 过 来 ， 
通货 及 胀 率 又 依赖 于 利率 (高 利率 降低 总 需求 ) ,但 利率 依赖 于 通货 膨胀 率 , 它 的 过 去 值 拟 
及 (预期 的 ) 未 来 值 。 因 而 ,短期 利率 是 内 生 的 ,短期 利率 变化 对 未 来 通货 膨胀 的 动态 因果 
效应 ,不 能 够 用 通货 膨胀 率 对 当前 和 过 去 利率 的 OLS 回归 一 致 地 知 计 出 来 。 


13.7.4 菲 利 浦 斯 曲线 


第 12 章 中 研究 的 菲 利 浦 斯 曲线 是 通货 膨胀 率 的 变化 对 通货 膨胀 滞后 变化 和 失业 率 清 
后 项 的 回归 。 由 于 失业 率 的 滞后 项 发 生 在 过 去 ,起 初 人 们 可 能 会 认为 不 可 能 存在 当前 通货 
有 陪 胜 率 对 失业 率 过 去 值 的 反馈 ,因此 ,可 以 将 失业 率 的 过 去 值 看 做 是 外 生 的 。 但 失业 率 的 过 
去 秆 在 一 个 实验 中 并 不 是 随机 分 配 的 ,相反 ,以 前 的 失业 率 和 通货 膨 了 的 过 去 值 是 联 立地 决 
定 的 。 由 于 通货 影 胀 率 和 失业 率 是 联 立 地 决定 的 ,因此 ,包含 在 u, 中 的 决定 通货 膨胀 的 其 
他 因素 与 失业 率 的 过 去 值 相 关 , 也 就 是 说 ,失业 率 不 是 外 生 的 。 由 此 得 出 ,失业 率 不 是 严 外 
生 的 ,所 以 实证 上 用 菲 利 浦 斯 曲线 ( 例如 ,公式 (12. 17 ) 中 的 ADL 模型 ) 所 计算 的 动态 对 数 
不 是 失业 率 变化 对 通货 及 胀 的 动态 因果 效应 的 一 致 性 估计 值 。 





[13.8_ 结论 - 


时 间 序 列 数据 提供 了 估计 XX 的 变化 对 了 的 效应 的 这 种 时 间 路 径 的 机 会 , 即 站 的 变化 对 
Y 的 动态 码 果 效应 。 然 而 ,要 利用 一 个 分 布 滞后 模型 估计 动态 因果 效应 ,X 必须 是 外 生 的 ， 





就 像 它 在 一 个 理想 的 随机 化 实验 中 被 随机 地 决定 那样 。 如 果 碟 不仅 是 外 生 的 ,而 且 还 是 严 
外 生 的 ,那么 动态 因果 效应 可 以 用 一 个 自 回 归 分 布 剖 后 模型 或 GLS 来 估计 。 

在 一 些 应 用 中 , 比如 估计 佛罗里达 州 籍 冻 天 气 对 橙 计价 格 的 动态 因果 效应 ,可 以 创造 一 
个 信人 信服 的 条 任 , 即 回归 因子 (冷冻 温度 日 ) 是 外 生 的 ,因此 ,该 动态 因果 效应 能 够 用 分 布 
清 后 系数 的 OLS 估计 方法 来 估计 。 但 即使 在 这 个 应 用 中 ,经 济 理论 指出 天 气 不 是 严 外 生 
的 ,ADL 或 GLS 方法 也 是 不 合适 的 。 此 外 ,在 许多 经 济 计量 学 家 感 兴趣 的 关系 中 存在 联 立 
因果 关系 ,所 以 ,这 些 设 定 中 的 回归 因子 不 是 外 生 的 , 既 不 是 严 外 生 的 ,也 不 是 其 他 外 生 的 。 
要 确定 回归 因子 是 否 是 外 生 的 (或 严 外 生 的 ) ,最 终 需 要 结合 经 济 理论 .制度 知识 和 专家 
判断 。 

: 总 结 - 

1. 时 间 序 列 中 的 动态 因果 效应 是 通过 一 个 随机 化 实验 来 定义 的 ,在 一 个 随机 化 实验 
中 ,相同 的 主体 (实体 ) 在 未 同 的 时 间接 受 不 同 的 随机 分 配 的 处 理 。 当 于 的 时 间 路 径 是 随机 
决定 的 ,并 且 不 受 那 些 能 够 影响 了 的 其 他 因素 的 影响 , 则 了 对 互 及 其 滞后 项 的 分 布 滞后 回 
归 的 系数 ,可 以 解释 为 动态 因果 效应 。 

2. 在 一 个 了 对 闭 的 当前 值 和 过 去 值 的 分 布 湛 后 回归 中 , 如果 误 差 u, 的 条 件 均 值 不 依 
赖 于 针 的 当前 值 及 过 去 值 ,那么 变量 站 是 (过 去 和 现在 ) 外 生 的 。 如 果 除 此 之 外 ,u, 的 条 件 
均值 还 不 依赖 于 诗 的 未 来 值 ,那么 了 是 严 外 生 的 。 

3. 如 果 了 是 外 生 的 ,那么 在 一 个 了 对 关 的 当前 值 和 过 去 值 的 分 布 滞后 回 妇 中 ,回归 系 
数 的 OLS 佑 计量 便 是 动态 因果 效应 的 一 致 性 估计 量 。 一 般 而 言 , 在 这 个 回归 中 的 误差 项 u 
是 序列 相关 的 ,所 以 ,常规 的 标准 误 是 误导 的 ,必须 使 用 HAC 标准 误 来 代替 它 。 

4. 如 果 开 是 话 外 生 的 ,那么 动态 乘 数 可 以 用 ADL 模型 的 OLS 来 估计 ,也 可 以 用 GIS 来 
估计 。 

5. 外 生性 是 一 个 较 强 的 假设 ,因为 存在 联 立 因果 关系 ,所 以 它 在 经 济 时 间 序 列 数 据 中 
常常 不 成 立 。 严 奸 生性 的 假设 是 一 个 更 强 的 假设 。 








[重要 术语 ] 


动态 因果 效应 ”分布 潍 后 模型 ”外 生性 Oh HERR MHAM RRAS 
乘 数 ”长 期 累积 动态 乘 数 ” 蜡 方差 一 自 相关 一 一 致 性 { HAC) 标 准 误 ”截断 参数 ” 纽 书 一 
韦 斯 特 方差 估计 量 ”广义 最 小 二 乘 (GLS) ” 准 差 分 不 可 行 的 GLS 估计 量 “可 行 的 GIS 
thii 


-复习 概念 - 


13.1 在 20 世纪 70 年 代 , 常 见 的 一 个 应 用 是 用 一 个 分 布 滞后 模型 估计 名 义 国 内 生产 
总 值 (了 ) 的 变化 与 货币 供应 量 (X) 的 当前 和 过 去 的 变化 之 间 的 关系 。 在 什么 样 的 假设 条 忻 
下 ,这 个 回归 会 估计 出 货币 对 名 义 国内 生产 总 值 的 因果 效应 ?这 些 假设 在 像 美国 这 样 国家 
的 现代 经 济 中 可 能 满足 玛 ? 

13.2 假设 和 是 严 外 生 的 。 一 位 研究 人 员 估 计 了 ADL(1,1) 模 型 ,计算 了 回归 残 差 ,并 





发 现 残 差 是 高 度 序列 相关 的 。 该 研究 人 员 应 该 估计 一 个 新 的 含有 额外 滞后 项 的 ADL 模型 ， 
还 是 只 对 ADIC1,1) 所 合计 的 系数 使 用 HAC 标准 误 ? 

13.3 ”假设 一 个 分 布 滞后 模型 被 估计 出 来 了 ,其 中 因 变 量 是 AY, 而 不 是 了。 请 解释 你 
如 何 计算 X, w$ Y, 的 动态 乘 数 。 

13.4 假设 你 在 公式 (13.2) PRM FDD, ,作为 一 个 额外 的 回归 因子 ,如 果 FDD 是 严 
外 生 的 ,那么 你 预期 FDD,, 的 系数 应 该 是 0 还 是 非 0? 如 果 FDD 是 外 生 的 而 不 是 严 外 生 
的 ,你 的 答案 会 变化 吗 ? 


[练习 - 


“13.1 在 发 达 国 家 的 几 次 经 济 衰退 期 间 ,石油 价格 的 上 涨 一 直 受 到 谴责 。 为 了 量化 
石油 价格 对 实际 经 济 活动 的 影响 ,研究 者 们 已 做 了 类 似 本 章 所 讨论 的 回归 。 设 GDP, 表示 
芋 国 季度 国内 生产 总 值 ,并 设 了 =100In( GDP,/GDP,., ) 为 GDP 的 季度 百分比 变化 。James 
Hamilton ,一 位 经 济 计 量 学 家 和 宏观 经 济 学 家 ,他 指出 只 有 当 石 油价 格 暴涨 到 它 的 近期 的 过 
去 值 之 上 时 , 它 才 会 反 向 影响 经 济 。 具 体 来 说 , 设 0, 等 于 0 或 日 期 上 时 的 石油 价格 与 其 在 
过 去 儿 年 中 最 大 值 的 百分点 差异 中 较 大 的 一 个 。 在 1955; 1 一 2000: 请 期 间 所 信 计 的 联系 


Y, 和 ,的 一 个 分 布 滞后 模型 是 ; 
LO 0.0550, 0.0260,, 0.0310., 0.1090,, 0.1280,, 





F= 0.1) (0.054) (0.057) (0.048) (0.02) (0.053) 

0.0080 ， 0.0250 0.0190,, 0.0670,， 

+t 0.025) +(0.048) (0.039) “00 042) 

a 想 设 石油 价格 在 前 一 次 峰值 之 上 暴涨 了 25% ,并 维持 在 这 个 新 的 较 高 水 平 上 ( 所 以 ， 
0 =25.0 = 0,., =…=0), 那 么 在 接 下 来 的 两 年 里 , 对 每 一 季度 产 出 增长 的 预测 效应 是 
什么 ? 

b. 为 你 在 (a) 中 的 答案 构造 一 个 站 名 的 置信 区 间 。 

c CDP 增长 的 累积 变化 在 未 来 8 个 季度 里 的 预测 值 是 多 少 ? 

d. 检验 0, 和 它 的 汪 后 项 的 系数 是 否 都 为 0 的 HACF 统计 量 为 3. 49。 这 些 系 数 都 显著 
地 异 于 0 吗 ? 

13.2 ”宏观 经 济 学 家 还 注意 到 ,石油 价格 暴涨 之 后 利率 会 变化 。 设 只 表示 3 个 月 短期 
国策 利率 (以 年 利率 的 百分点 表示 ) ,在 1955; 1 一 2000; 期 间 所 估计 的 联系 上 的 变化 
(AR) 0, 之 间 关 系 的 分 布 灌 后 回归 是 : 

ap- %07 , 00620. 0.0480,., 0.0140,, 0.0860,., 0.0000,.。 

:0.06) (0.045) (0.034) (0.028) (0.169) ` (0.058) 
0.0230,., 0.0100,.。 0.1000,., 0.0140,. 
(0.065) (0.047) (0.038) “~ (0.025) 

a. 假设 石油 价格 在 前 一 次 峰值 之 上 暴涨 了 25 锡 ,并 维持 在 这 个 新 的 较 高 水 平 上 (所 以 
0,=25,0,,, = 0,,, =" =0) ,那么 在 接 下 来 的 两 年 甘 , 每 一 季度 利率 的 预测 变化 是 什么 ? 

b. 为 你 在 (ze) 中 的 答案 构造 一 个 站 锡 的 置信 区 间 。 

e. 在 时 期 :+8, 石 油价 格 的 这 种 变化 对 利率 水 平 的 效应 是 多 少 ” 你 的 答案 与 累积 乘 数 
之 间 有 什么 关系 ? 

d. 检验 0, 和 它 的 滞后 项 的 系数 是 否 都 为 0 这 一 假设 的 HACF 统计 量 为 4. 25。 这 些 系 
数 都 显著 地 异 于 0 吗 ? 








13.3 考虑 两 个 不 同 的 随机 化 实验 。 在 实验 A 中 ,石油 价格 是 随机 制定 的 ,中 央 银 行 
恨 据 它 对 经 济 状况 (包括 石油 价格 的 变化 ) 做 出 反应 的 通常 政策 规则 制定 政策 。 在 实验 了 
中 , 右 油价 格 是 随机 制定 的 ,中 央 银 行 保持 利率 不 变 , 尤 其 是 对 石油 价格 的 变化 不 作 反 应 ， 
在 这 两 个 实验 中 ,GDP 增长 是 可 观测 的 。 现 在 假设 练习 13.1 的 回归 中 石油 的 价格 是 外 生 
的 ,练习 13. 1 中 所 估计 的 动态 因果 效应 符合 哪 一 个 实验 ,A& 还 是 了 ? 

13.4 假设 石油 价格 是 严 外 生 的 ,讨论 你 如 何 改 善 练习 13. 1 中 动态 乘 数 的 估计 值 。 

13.5 根据 公式 (13.4) 推 导 公 式 (13.7) ,证 明 .& =8,8 =B,,8, =A +B,,6; =B +B, 
+B, F, CERE X, =AX +AX, + AX, ,1 AX) 


附录 13. 1 楼 汁 数据 集 


橙 计 价格 数据 是 由 美国 劳工 统计 局 (BLS 序列 wpu02420301 ) 所 搜集 的 生产 者 价格 指数 
(PPI) 中 的 加 工 食品 和 饲料 类 中 的 冷冻 查 社 部 分 。 检 计价 格 数据 序列 除 以 制 成 品 的 总 体 
PPI 来 调整 总 体 价格 水 平 的 通货 膨胀 。 冷 冻 注 度 日 序列 是 用 从 美国 高 业 部 的 国家 海洋 和 气 
象 局 (NOAA) 所 得 到 的 奥兰多 机 场地 区 的 日 最 低温 度 记录 来 构造 和 的 。FDB 序列 的 构造 使 得 
它 的 时 间 安 排 和 橙 计价 格 数据 的 时 间 安 排 近似 地 匹配 。 具 体 来 说 ,冷冻 橙汁 的 价格 数据 是 
在 每 个 月 的 中 旬 通 过 调查 一 个 生产 者 样本 来 搜集 的 ,尽管 搜集 数据 的 确切 日 期 在 各 个 月 份 
有 所 不 同 。 因 此 ,FDD 序列 被 构造 为 从 一 个 月 的 11 号 到 下 一 个 月 10 号 的 冷冻 温度 日 数 ， 
即 FDD 是 0 和 32 减 去 当日 最 低温 度 这 两 个 数据 中 的 最 大 值 ,然后 从 当月 的 11 号 到 下 月 的 
10 导 对 这 期 间 的 FDD 求 和 。 因 此 ,2 月份 的 % Chap, 就 是 从 1 月 中 旬 到 2 H p Ah etr 
价格 的 百分比 变化 ,而 2 月 份 的 FDD, 则 是 从 1 月 11 日 到 2 月 10 日 的 冷冻 温度 日 数 . 


[附录 13.2 ”用 滞后 算 子 符号 表示 ADI. 模型 与 广义 - 


本 附录 给 出 了 用 滞后 算 子 符号 表示 的 分 布 滞后 模型 ,推导 了 分 布 滞后 模型 的 ADL AE 
差分 代表 式 ,并 讨论 了 了 ADL 模型 比 初始 的 分 布 滞 后 模型 合 有 更 少 的 参数 的 条 件 。 


用 滞后 算 子 符号 表示 的 分 布 滞后 .ADL 和 准 差 分 模型 
和 附录 12. 3 中 所 定义 的 一 样 , 游 后 算 子 具有 性 质 LX =X,-,, 并 能 够 将 分 布 液 后 BX 





+B,X,. tee +B. X... AmA B(L)X,,iX I L) = > BaL. EH L =1。 因 此 .重要 要 
念 13.1 中 的 分 布 滞后 模型 (公式 (13.4) ) 可 以 用 滞后 算 子 符号 写 为 ; 


Y, = +B( L)X, +u, {13. 40) 
5k W FRAN u, 满足 AR( P) ,那么 它 可 被 号 为 : 
#(L)u,= ú (13.41) 


EH olL) = Y $U, l,i 是 序列 无 关 的 (注意 ,这 里 定义 的 由，…, 中 ,是 公式 


=Ü 


(13. 31) 的 符号 中 办，… ,由 ,的 负数 )。 
为 了 推导 ADL 模 型 ,将 公式 (13. 40) 的 两 边 前 乘 $(L) ,因此 有 : 
pF =p(L) [B +8(L)X, +u,] =e +8(L) X, +, (13.42) 





其 中 : 
as =B lL) ADEL ,这 里 的 b(1) = Y é, (13.43) 


要 推导 准 差 分 模型 ,注意 $(L)B(L)X, =B(L)#(L)X, =AL) jKH X =0(L)X,., H 
此 ,重新 整理 公式 (13. 42) ,得 到 ; 
Y =a +B(L)Y +z (13.44) 


其 中 ,上 上 是 了 EAD, È =AL) Y, 
ADL 和 GLS 佑 计量 


ADL 系数 的 OLS 估计 量 是 用 公式 {13.42) 的 OLS 估计 得 到 的 。 初 始 的 分 布 滞后 系数 
是 BLL) ,用 所 估计 的 系数 来 表达 ,有 BCL) =8(L)/e(L) ,也 就 是 说 ,B(L) 中 的 系数 满足 
PLIEC) =6() 所 隐 含 的 约束 条 件 。 因 此 ,基于 ADL 模型 系数 的 OLS 估计 量 $(L) 和 
$(L) 的 动态 乘 数 估计 量 为 : 

Ê (L) =&L) ACL) (13.45) 
教材 中 公式 (13. 29) 的 系数 表达 式 可 作为 公式 (13. 45) 中 的 一 个 特例 ,在 那里 r=1,p =1。 

可 行 的 GLS 估计 量 ,是 通过 获得 一 个 初步 的 由 (L) 估计 量 计 算出 估计 的 准 差分 ,用 这 些 
估计 的 准 差分 估计 公式 (13. 44)} 中 的 B(L) ,并 进行 迭代 (如果 需 要 的 话 ) 直到 收 敏 计算 出 来 
HJ. ERR CLS 佑 计量 就 是 使 用 公式 (13.42) 中 ADL 模型 的 NLLS 估计 所 计算 出 来 的 
NLLS 估计 量 , 它 要 受 公式 (13. 4 ) 中 参数 的 非 线性 约束 条 件 所 限制 。 

正 像 教材 中 国 绕 公 式 (13. 36 ) 的 讨论 所 强调 的 ,要 使 艺 ( 过 去 和 现在 ) 是 外 生 的 ,只 使 用 
上 述 两 种 估计 方法 是 不 够 的 ,因为 只 有 外 生性 并 不 能 保证 公式 (13.36) 成 立 。 不 过 ,如 果 于 
是 严 外 生 的 ,那么 公式 (13. 36) 确 实 成 立 , 并 且 假 定 重要 概念 12.6 中 的 想 设 2 -4 成 立 , 则 这 
些 估 计量 是 一 致 的 生 近 正 态 的 。 此 外 ,通常 的 { 截面 的 异 方差 稳健 的 OILS 标准 误 为 统计 
推断 提供 了 一 个 有 效 的 基础 。 

用 ADL 模型 减少 参数 。 假 设 分 布 灌 后 多项式 8(L) 可 写成 一 个 灌 后 多 项 式 之 比 , 即 
0 (L)/0,(L), X E 0, (L) fl 0, ( L) 88 É IK BT tyi Ja E, 3 2 Z: (13.43) 中 的 
4$(L)8(L)=4(L)0 (L)/0,(L)=[#$(1L)/0,(L)]60 (L), 30882 (L) =0,(L),W 
ó(L) =à(L)8(L)=0 (L), WE (LRM, IWA ADL 模型 中 工 的 河 后 期 数 g 会 比 r 
小 很 多 。 因 此 ,在 这 些 假设 下 ,ADL 模型 的 估计 需要 潜在 地 估计 比 最 初 的 分 布 满 后 模型 少 
很 多 的 参数 。 正 是 在 这 个 意义 下 ,ADL 模型 能 够 获得 比分 布 滞后 模型 更 节省 的 参数 数量 
《即使 用 更 少 的 未 知 参 数 ) 。 

恕 这 里 所 推导 的 ,$(L) 和 8,1) 碰巧 相同 这 一 假设 ,在 应 用 中 似乎 是 不 可 能 会 发 生 的 
一 种 巧合 。 不 过 ,ADL 模型 能 够 用 较 少 的 几 个 系数 捅 控 到 动态 荚 数 中 大 量 的 形态 变化 。 正 
是 由 于 这 个 原因 ,只 要 于 是 严 外 生 的 ,ADL 模型 的 无 约束 估计 就 提供 了 一 种 近似 等 同 于 一 
个 长 分 布 滞后 的 ( 即 许多 的 动态 乘 数 ) 很 有 吸引 力 的 方法 。 








a14s 
时 间 序 列 回归 的 
其 他 议题 


本 章 讨 沦 时 间 序 列 辐 归 的 一 些 其 他 话题 ,我 们 先 从 预测 开始 。 第 12 章 考 虑 了 单个 变量 
的 预测 ,然而 在 实际 中 ,你 可 能 想 要 预测 两 个 或 两 个 以 上 的 变量 ,比如 通货 脑 胀 率 和 GDP H 
K#, 14.1 节 介绍 了 一 个 用 来 预测 多 元 变量 的 模型 , 即 向 量 自 回归 (VAR) ,这 个 模型 使 用 
两 个 或 多 个 变量 的 滞后 值 以 预测 这 些 变量 的 未 来 值 。 在 第 12 章 ,我 们 还 集中 关注 了 对 来 来 
一 个 时 期 {如 一 个 季度 ) 的 预测 问题 ,但 对 未 来 的 2 个 .3 个 或 更 多 时 期 进行 预测 也 是 重要 
的 。14, 2 节 中 讨论 了 进行 这 样 预测 的 方法 。 

14.3 节 和 14.4 节 回 到 12.6 节 讨 论 的 关于 随机 性 趋势 的 话题 。14.3 节 介 绍 了 其 他 一 
些 随机 性 趋势 模型 和 另 一 种 检验 单位 自 回 归根 的 方法 。14.4 节 介 绍 了 协 整 的 概念 , 当 两 个 
变量 拥有 共同 的 随机 性 趋势 时 ,也 就 是 说 , 妆 两 个 变量 都 包含 随机 性 趋势 ,但 两 个 亦 量 的 加 
权 盖 分 却 不 念 随机 性 趋势 时 就 产生 了 协 整 。 

在 一 些 时 间 序 列 发 据 中 ,尤其 是 金融 数据 中 ,方差 随时 间 的 变化 而 变化 :有 时 序列 会 表 
现 出 高 的 波动 性 ,而 有 时 波动 性 却 很 低 ,这 样 就 出 现 了 效 据 序列 中 的 波动 集聚 现象 。14.5 
节 讨 了 沦 了 波动 集聚 问题 ,并 引入 了 处 理 流动 集聚 的 模型 ,在 这 些 模 型 中 ,预测 误差 的 方差 随 
时 间 的 变化 而 变化 , 印 预 测 误 差 是 条 件 异 方 差 的 。 条 件 异 方差 模型 有 好 几 个 应 用 。 一 个 应 
用 是 计算 预测 区 间 ,这 里 的 区 闻 宽 度 随 时 间 变 化 而 变化 ,以 反映 不 同时 期 不 确定 性 的 差异 。 
另 一 个 频 用 是 预测 一 项 资产 (比如 说 股票 ) 收 着 的 不 确定 性 ,这 反 过 来 多 可 能 对 评估 村 有 上 服 
票 的 风险 有 用 。 


4.1 agga 


第 12 章 集 中 于 预测 通货 膨胀 率 , 但 实际 上 经 济 预 测 者 也 忙于 预测 其 他 重要 的 宏观 经 济 
变量 ,比如 说 失业 率 .GDP 增长 率 和 利率 。 一 种 方法 是 用 12. 4 节 中 的 方法 对 每 个 变量 建立 
单独 的 预测 模型 ,而 另 一 种 方法 是 设计 一 个 能 够 预测 所 有 变量 前 单个 模型 , 它 有 助 于 使 着 











测 相互 一 黎 。 用 单个 模型 预测 几 个 变量 的 一 种 方法 是 使 才 向 量 自 回 归 (VAR) 。VAR 将 单 
变量 自 回归 推广 到 多 元 时 间 序列 变量 , 即 它 将 单 变量 自 回归 推广 则 时 间 序 列 变 基 的 一 个 
“BHR” o 


14.1.1 VAR 模型 


向 量 自 加 归 { vector autoregression } 简称 VAR, 它 售 有 两 个 时 间 序 列 变量 了 和 天, 包 
括 两 个 方程 :在 -- 个 方程 中 因 恋 量 是 世 ,在 另 一 个 方程 中 国 变量 是 站 。 两 个 方程 中 的 回 啊 
因子 是 这 两 个 变量 的 滞后 值 。 更 一 般 地 说 ,含有 上 个 时 间 序 列 变量 的 VAR 由 个 方程 组 
成 , 千 个 方程 对 应 一 个 变量 ,所 有 方程 中 的 回归 因子 是 所 有 各 自 变 基 的 兴 后 值 。VaAR 方程 
的 系数 通过 OLS 方法 来 估计 。 

VAR 存 重要 概念 14. 1 中 总 结 。 


重要 概念 14.1 


EE ICES 
向 量 自 回归 是 个 时 间 序 列 四 妇 的 一 个 集合 ,其 中 回归 因子 是 所 有 上 个 序列 的 洁 后 值 。 
-个 YAR 将 单 变量 自 回归 扩展 到 时 间 序 列 变量 的 一 个 列表 或 时 间 序 列 变量 的 一 个 “向 
量 ”"。 当 每 个 方程 中 的 滞后 期 数 相同 且 等 于 p 时 ,该 方程 系统 被 称 为 YAR{Pp)。 
在 有 两 个 时 间 序 列 变量 Y. MA, 的 情况 下 ,YAR(p) 由 两 个 方程 组 成 ; 
F, SBa +u Fei +t tT tyiX, t th tu, (14.1) 
X =a ta Y, t tT ,+ pd +u ty Y... + us (14.2) 
其 中 到 和 7 是 未 知 系数 ,和 心 是 误差 项 。 
VAR 的 假设 ,就 是 重要 概念 12. 6 中 的 时 间 序 列 回归 假设 ,这 些 假设 适用 于 这 里 的 每 个 
方程 。YAR 的 系数 是 用 OLS 对 每 个 方程 进行 估计 的 。 
VAR 的 惟 汤 。 在 VAR 假设 下 ,0LS 估计 量 在 大 样本 条 件 下 是 一 至 的 ,并 且 具 有 联合 正 
态 分 布 。 因 此 ,统计 推断 以 通常 的 方式 进行 ,例如 ,可 将 系数 听 名 的 置信 区 间 构 造 为 所 估计 
的 系数 +1.96 倍 标准 误 。 
# VAR 的 假设 检验 中 出 现 了 一 个 新 的 方面 ,因为 含有 个 变量 的 VAR 是 个 方程 的 
组 合 或 系统 。 因 而 ,检验 涉及 多 个 方程 之 间 的 约束 条 件 的 联合 假设 是 可 能 的 。 
例如 ,在 公式 (14. 1) 和 和 公式 (14.2) 的 两 变量 VAR{P) 中 ,你 可 能 会 问 正 确 的 滞后 长 度 
是 bp 还 是 p -1, 也 就 是 说 ,你 可 能 会 问 这 两 个 方程 中 ,和 大., 的 系数 是 否 都 为 0。 这 些 系 
数 都 为 0 HERRE: 
Ho B =0 By =0,y, =0,7, =0 (14.3) 
备 择 假设 就 是 这 4 个 系数 中 至 少 有 一 个 不 为 0。 因 而 , 零 假 设 涉及 了 来 自 于 这 两 个 方程 的 
系数 ,每 个 方程 有 两 个 系数 。 
因为 在 太 样 本 条 人 忻 下 所 估计 的 系数 具有 联合 正 态 分 布 ,所 以 ,通过 计算 下 统计 其 来 检 
验 这 些 系数 的 约束 条 件 是 可 能 的 。 这 个 统计 量 的 精确 表达 式 是 复杂 的 ,因为 运算 符号 必须 
处 理 多 个 方程 ,所 以 我 们 省 略 了 它 。 实 际 上 ,大 多 数 现代 软件 都 包含 有 检验 多 个 方程 系统 的 
系数 假设 移 自 动 程序 。 
在 VAR 中 应 该 包含 多 少 个 变量 ?YAR 的 每 个 方程 中 系数 的 个 数 与 VAR 中 变量 的 个 
数 成 比例 。 例 如 ,一 个 含有 5 个 变量 和 四 阶 汪 后 的 VAR 在 这 5 个 方程 的 每 个 方程 中 将 有 21 














个 系数 (5 个 变量 每 个 都 有 四 阶 问 后 ,加 上 一 个 截 距 项 ) ,共计 105 个 系数 ! 估计 所 有 这 些 系 
数 会 增加 进 人 预测 中 的 估计 误差 的 数量 ,这 会 导致 预测 精度 的 鞋 化 。 

一 个 实际 应 用 中 的 问题 是 ,要 使 VAR 中 变量 的 个 数 尽 量 地 少 ,特别 是 要 确保 所 包含 的 
变量 彼此 之 闻 是 相互 关联 的 ,这 样 它们 在 相互 预测 时 才 是 有 用 的 。 贫 如 ,我 们 从 经 验证 据 和 
经 济 理论 的 组 合 中 知道 ,通货 膨胀 率 ,失业 率 和 短期 利率 是 彼此 相关 联 药 ,这 表明 这 些 变量 
可 以 在 一 个 YAR 模型 中 互相 预测 。 不 过 ,把 一 个 无 关 的 变量 包含 在 VAR 中 不 会 增加 预测 
内 容 , 反 而 会 引 八 估计 误差 ,因此 会 降低 预测 精度 。 

确定 VAR 中 的 滞后 长 度 . 中 VAR 中 的 滞后 长 度 既 可 用 下 检 验 ,也 可 用 信息 准则 来 
确定 。 l 

一 个 系统 方程 的 信息 准则 ,扩展 了 12.5 节 中 的 单方 程 信息 准则 。 要 定义 这 个 信息 准 


则 ,我 们 需要 采用 和 矩阵 运算 符号 。 设 互 为 YAR RAN kxk 阶 协 方 差 矩阵 ,并 设立 为 这 
个 协 方差 矩阵 的 估计 值 ,这 里 立 的 i,j 元 素 为 TÈ ui, rh u RS i BB) OLS sË 


žE] 个 方程 的 OLS 残 差 。 VAR 的 BIC 为 : 
BIC(p) =In( det(£,)1 +h(ip + BE (14.4) 


tri ,de( £.) EERE Í, 的 行列 式 。 计 算 AIC 可 通过 用 “2" 代 替 “"ln7" 项 修正 公式 (14.4) 。 

在 公式 {14.4) 中 ,VAR 中 天 个 方程 的 BIC 表达 式 扩 展 了 12.5 节 中 所 给 出 的 单方 程 表 
达 式 。 当 内 有 一 个 方程 时 ,第 一 项 简化 为 m SSR(p)AT1。 公 式 (14.4) 中 的 第 二 项 是 对 增 
加 额外 回归 因子 的 逢 罚 ;EK( 甸 +1) 是 YAR 中 回归 系数 的 总 数 ( 有 上 大 个 方程 ,每 个 方程 含有 一 
个 截 距 项 和 上 个 时 间 序 列 变量 中 每 个 变量 的 p 阶 洁 后 ) 。 

VAR 中 谐 后 长 度 的 合计 类 似 于 单方 程 的 情形 ,也 使 用 BC: 在 一 组 己 个 候选 值 中 ,所 个 
计 的 滞后 长 度 是 使 BIC(p) 最 小 化 的 那个 p 值 。 

将 YAR 用 于 因果 关系 分 析 。 到 自前 为 止 ,我 们 的 讨论 都 集中 在 使 用 VAR 进行 预测 上 。 
VAR 模型 的 另 一 个 应 用 是 分 析 经 济 时 间 序 列 变量 之 间 的 因果 关系 。 事 实 上 ,最 初 正 是 为 了 
这 个 目的 ,VAR 才 被 经 济 计量 学 家 和 宏观 经 济 学 家 Christopher Sims 引 人 到 经 济 学 中 。VAR 
用 于 因果 关系 推断 ,就 是 大 家 所 熟知 的 结构 VAR 建 模 ,之 所 以 称 之 为 “结构 ” ,是 因为 在 这 
个 应 用 中 VAR 被 用 来 建立 基础 的 经 济 结构 模 型 。 结 构 VAR 分 析 使 用 本 节 中 所 介绍 的 在 预 
测 方 面 的 技术 和 一 些 其 他 的 工具 。 不 过 ,将 VAR 用 于 预测 和 结构 建 模 之 间 最 大 的 概念 上 的 
差异 是 ,结构 建 模 需要 非常 具体 的 假设 ,哪些 是 外 生 的 ,哪些 不 是 外 生 的 ,这 些 假 设 是 从 经 济 
理论 和 制度 知识 中 推导 出 来 的 。 对 结构 VAR 的 讨论 最 好 是 在 联 立 方程 系统 的 估计 意义 下 
进行 ,不 过 这 超出 了 本 书 的 范围 。 对 于 将 VAR 模型 用 于 预测 和 政策 分 析 方 面 的 介绍 ,请 见 
Stock 和 Waston(2001 ) 。 关 于 结构 VAR 建 模 的 额外 的 数学 细节 ,请 见 Hamilton ( 1994 ) 或 
Waston( 1994). 


14.1.2 通货 膨胀 率 和 失业 率 的 VAR 模型 


作为 一 个 例子 ,考虑 通货 膨胀 率 m, 和 失业 率 Unemp, 的 两 变量 VAR 模型 。 和 第 12 章 
一 样 ,我 们 将 通货 膨 且 率 看 做 是 含有 郑 机 性 趋势 的 ,所 以 通过 计算 它 的 一 阶 差分 Af. 进行 
变换 是 合适 的 。 





全 ”这 一 节 用 到 矩阵 ,对 不 需要 杖 较 多 数学 运算 的 读 着 来 说 可 以 辐 过 本 节 。 


个 季度 进行 的 未 来 两 期 的 预测 值 也 是 过 低 的 。 因 此 ,下 个 季度 石油 价格 的 意外 上 涨 意 味 着 
上 个 季度 和 这 个 季度 的 前 两 期 的 预测 值 都 太 低 。 由 于 这 个 干扰 事件 ,多 期 回归 中 的 误差 项 
是 序列 相关 的 。 

如 13.4 节 中 所 讨论 的 ,如 果 误 差 项 是 序列 相关 的 ,那么 通常 的 OLS 标准 误 是 不 正确 
的 ,或 更 准确 她 说 ,它们 不 是 统计 推断 的 可 人 靠 基础 。 因 此 ,在 多 期 回归 中 必须 使 用 异 方差 一 
自 相关 一 一 致 性 (HAC) 标准 误 。 因 而 ,本 节 所 报告 的 多 期 回归 的 标准 误 是 纽 韦 一 韦 斯 特 
HAC 标准 误 , 其 中 茂 断 参数 m 是 根据 公式 (13. 17) 来 确定 的 ,对 这 里 的 数据 (T= 152) 而 言 ， 
公式 (13.17) 得 出 严 =4。 随 着 预测 期 的 变 长 ,误差 中 序列 相关 的 程度 也 会 增加 ,一 般 而 言 ， 
在 前 疡 期 的 回归 中 ,误差 项 的 前 六 -~ 个 自 相关 系数 都 是 非 零 的 。 因 此 ,大 的 m 值 比 公式 
(13. 17) 所 指示 的 值 更 适用 放 长 预测 区 间 的 多 期 回归 。 

JAIR AR 预测 法 :AR(1) AÈ AR 预测 法 使 用 AR 模型 将 前 1 期 的 预测 扩展 到 前 两 期 
或 更 多 期 的 预测 。 前 两 期 的 预测 分 两 步 进行 计 算 。 第 一 步 , 前 1 期 的 预测 像 12. 3 节 中 那样 
来 计算 。 第 二 步 ,利用 该 预期 的 前 1 期 预测 值 来 计算 前 两 期 的 预测 值 。 因 此 ,前 1 期 的 预测 
值 用 作 前 两 期 项 测 的 中 间 步 又 。 对 了 于 更 远 的 期 限 , 这 个 过 程 被 重复 或 “迭代 ”进行 。 

作为 一 个 例子 ,考虑 Anf, 的 一 阶 自 回归 (公式 (12.7)), 即 ; 


AN, 
Amf= 00 - 0. 21Amf_, 
(0.14) (0.11) 


根据 公式 (14.9) ,使 用 直到 1999 :六 的 数据 ,计算 Anfo. 的 前 两 期 ( 季 ) 的 预测 值 的 第 一 
步 ,就 是 根据 直到 1999: 了 的 数据 计算 Alfa, + 的 前 1 期 ( 季 ) 的 预测 值 ; Bo 3 ow = 
0.02 -0. 21Afnf w. y =0.02 -0.21 x0.4 = -01。 在 第 二 步 中 ,将 这 个 预测 值 代 人 公式 
(14.9) ,Bp Áyo ps y = 0.02 ~ 0.21 fawo. wy=002-021x(-01)=00。 因 
此 ,根据 直到 1999 年 第 四 季度 的 信息 ,这 个 预测 值 就 是 ,在 2000 年 第 一 季度 和 第 二 季度 之 
间 通 货 膨 胀 率 将 不 会 发 生变 化 。 

IEIR AR 预测 方法 ;AR(p) .通过 将 所 合计 的 AR(p) 中 的 7. ,替换 为 它 的 前 期 所 做 的 


预测 值 ,可 将 迭代 的 AR(1) 方 法 扩展 到 AR{p)。 
例如 ,考虑 12.3 节 中 基于 AR(4) 模 型 (公式 (12. 13) ) 的 选 代 的 前 两 步 通货 脱 联 预测 ， 


人 = 002 - 02anf - 032A + O. Amf- 0 MAR, a 
(0.12) (0.10) (0.09) (0.095 (0.10) 


(14.9) 


(14,105 


选 代 的 前 两 期 预测 值 ,是 用 预测 值 Ki 池 ， 代 赫 公 式 (14. 10) 中 的 Anf, ,来 计算 的 。 在 12.3 
节 中 ,我 们 根据 直到 1999 :六 的 数据 ,使 用 这 个 AR RRA Anfo. 的 预测 值 为 
A ww ，=0.2。 因 此 ,基于 AR(4) 模 型 的 前 两 个 季度 的 欠 代 预测 值 为 Tio, rus 


=0.02 -0.21 A ruan. ~ 0. 32A1rfo wy +0. I9ADf.ə9.a ~ 0 04ATrfog,n =0.02 ~0.21 
x0.2 -0.32x0.4+0 19 x0. 1 -0.04x1.1= -0.2, 根据 这 个 六 代 的 AR(4) 和 预测 值 ,以 直 
šJ 1999 年 第 四 季度 的 数据 为 基础 ,该 通货 膨胀 率 在 2000 年 第 一 季度 和 第 二 季 诬 之 间 将 下 


降 0.2 个 百分点 。 
多 期 单 变量 预测 的 这 两 种 方法 在 重要 概念 14.2 中 总 结 。 
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重要 概念 14. 2 


使 用 单 变 量 自 回 归 的 多 期 预测 

首先 , 稍 讨 多 期 回归 方程 : 

Y. =à, r+8 Ya + + tu, (14.11) 
然后 用 所 估计 的 系数 计算 提前 产 期 的 预测 值 , 进 而 计算 基于 AR(p) 的 未 来 hh 期 的 多 期 回归 
预测 值 (multiperiod regression forecast) 。 

和 迭代 前 AR MA iterated forecast) 是 分 步 计 算 的 : 先 计 算 往 前 1 期 的 预测 值 ,然后 用 它 
计算 往 前 两 期 的 预测 值 , 依 此 类 推 。 基 于 AR(p) 模 型 的 往 前 两 斯 和 3 期 的 选 代 预 测 是 : 

PB BB +Â Y,a +. +É Y... (14.12) 

FAR =Ê +Ê, Êu- +ÊY, aua + 房 了 .， +=. +B,Y,_, (14.13) 


Heh Â E AR(p) 系 数 的 OLS 估计 值 。 重 复 这 个 过 程 (“ 选 代 ”) ,得 到 对 未 来 更 远 期 的 预测 。 


14.2.2 多 期 预测 ;多 变量 预测 


从 单 变 量 模型 中 得 出 的 多 期 预测 的 两 种 方法 同样 可 用 于 多 变量 预测 的 回归 中 。 
多 期 回归 方法 ”在 一 般 的 多 期 园 归 方法 中 ,所 有 的 预测 因子 都 被 带 后 期 ,以 得 到 未 来 
h 期 的 预测 值 。 
侈 如 ,首先 通过 估计 回归 方程 (14. 14) 来 计算 使 用 Af, 和 Unemp, 中 每 个 四 阶 滞后 的 
前 两 个 季度 的 Am, 预测 值 。 
Ll = 0.27 - 0. BAhf ,+ O 15A- D. HA- 0.06AD7_, 
(0.40) (0.11) (0. 10) (0.11) (0.08) 


— 0.21Unemp,., + O. 79Unemp,.,- 2, JlUnemp,.s+ 1.49Unemp,.s 
(0.46) (0.98) (1.12) (0.56) 


将 AT s Adn ioog.m ' Unemp ogo,1 |... , Unemp ig. y 的 值 代 人 公式 ! 14.14) ,可 以 计算 往 前 两 季 
的 预测 值 ,这 得 出 r mmo = 0.27 — 0.288, + 9. Anfi | - 021ATnfig,n 


-0. 06A bfign — 0. 21 Unemp ony +0. T9Unemp,, g — 2. 1LUnemp gn g + 1. 49Unempi 1 = 0. 0, 

通过 将 公式 (14. 14) 中 的 所 有 回归 因子 滞后 1 个 季度 ,估计 那个 同 归 , 并 计算 预测 值 来 
计算 往 前 3 期 的 Af. 预测 值 , 对 于 末 来 更 远 期 的 预测 值 也 依 此 类 推 计算 。 

ISIE YAR Hij. WARRE AR 方法 经 过 一 定 的 修正 后 就 可 将 其 扩展 为 YAR 模型 ,由 
于 VAR 含有 1 个 或 多 个 额外 的 预测 因子 ,因此 ,有 必要 计算 所 有 预测 因子 的 中 间 预 测 值 。 

往 前 两 期 的 选 代 的 VAR RAA (iterated VAR forecast) 分 两 步 计算 。 第 一 步 ,和 14.1 节 
中 所 讨论 的 一 样 , 用 VAR 生成 该 YAR 中 所 有 变量 的 往 前 工 季 的 预测 值 。 第 二 步 , 用 这 些 预 
测 值 代替 该 VAR 中 的 一 阶 沼 后 值 ,也 就 是 说 , 往 前 两 期 的 预测 值 是 以 往 前 1 期 的 预测 值 和 
VAR 中 所 设 定 的 额外 滞后 项 为 基础 的 。 重 复 这 个 过 程 可 得 到 对 未 来 更 远 期 的 迁 代 VAR TH 
测 值 。 

作为 一 个 例子 ,根据 14.1 PP Amn, 和 Unemp, Éy VAR (4) (公式 (14.5) 和 公式 
(14.6) ) ,以 直到 1999: 下 的 数据 为 基础 ,我 们 计算 Mho. 的 选 代 VAR 预测 值 。 第 一 步 ， 


根据 这 个 VAR 模型 计算 往 前 1 个 季度 的 预测 值 o.oo wy 和 Cirenipmoo.1 uwo fE 12.3 


(14.14) 


软件 执行 起 来 最 方便 。 
14.3 单 整 阶 数 和 其 他 的 单位 根 检 验 


本 节 通 过 强调 两 个 进一步 的 话题 ,扩展 了 12.6 节 中 对 随机 性 趋势 的 处 理 方法 。 首 先 ， 
一 些 时 间 序 列 的 趋势 没有 被 随机 游 动 模型 很 好 地 描述 ,所 以 我 们 介绍 该 模型 的 推广 形式 ,并 
讨论 了 它 对 这 种 序列 的 回归 建 模 的 含义 。 其 次 ,我 们 继续 讨论 在 时 间 序 列 数据 中 和 其 他 问 
题 中 的 单位 根 检验 问题 ,并 介绍 了 另 一 种 单位 根 检验 方法 。 


14.3.1 其 他 的 趋势 模型 和 单 整 的 阶 数 


回想 一 下 在 12.6 节 中 所 介绍 的 趋势 随机 游 动 模型 ,该 模型 设 定 ,时 期 1 的 趋势 等 于 时 
期 -1 的 趋势 加 上 一 个 随机 误差 项 。 如 果 了 服从 带 漂移 项 8, 的 随机 游 动 ,那么 : 
Y, =f +Y. +u, (14.18) 
其 中 ,uw 是 序列 无 关 的 。 再 回忆 一 下 12.6 节 , 如 果 一 个 序列 含有 随机 游 动 趋势 ,那么 它 有 一 
个 等 于 1 的 自 回归 根 。 
尽管 一 个 趋势 的 随机 游 动 模型 描述 了 许多 经 济 时 间 序 列 的 长 期 趋势 ,但 有 些 经 济 时 间 
序列 的 趋势 比 公式 (14. 18) 所 隐 含 的 趋势 更 平滑 , 即 前 后 期 之 间 变 化 较 小 。 因 此 ,需要 一 个 
不 同 的 模型 来 描述 这 种 序列 的 趋势 。 
平滑 趋势 的 一 个 模型 使 得 该 趋势 的 一 除 差分 服从 随机 游 动 , 即 ， 
AY =8,+AY._, +u, (14.19) 
其 中 ,uw 是 序列 无 关 的 。 如 果 Y, 满足 公式 (14, 19) ,AY, 服从 随机 游 动 , 则 AY, -AZ 是 平 
稳 的 。 一 阶 差分 的 差分 AY, - AF._| 被 称 为 7 的 二 阶 差分 { second difference) ,表示 为 A2Y, 
=AY, -AY,.,。 在 这 个 术语 下 ,如 果 Y, 满足 公式 (14. 19) ,那么 它 的 二 阶 差分 是 平稳 的 。 如 
果 一 个 序列 具有 公式 (14. 19) 形 式 的 趋势 , 则 该 序列 的 一 阶 差 分 有 一 个 等 于 1 的 自 回归 根 。 
RA RRRS. 为 了 区 分 这 两 个 趋势 模型 , 引 人 一 些 额 外 的 术语 是 必要 的 。 一 个 合 
有 随机 游 动 扑 势 的 序列 被 称 为 是 一 阶 单 整 的 {Integrated of order one) ,或 (1)。 一 个 合 有 
公式 (14. 19) 形 式 的 趋势 的 序列 被 称 为 是 二 阶 单 整 的 {integrated of order two) ,或 12)。 
一 个 不 合 随 机 性 趋势 的 平稳 序列 被 称 为 是 零 阶 单 整 的 (integrated of order zero) ,或 /{0})。 
在 1(1) 和 71(2) 术 语 中 的 单 整 阶 数 (order of Integration) ,是 指 为 了 使 该 序列 平稳 需要 
将 其 差分 的 次 数 :如 果 了 是 1(1) 的 ,那么 的 一 除 差 分 AY, 是 平稳 的 ;如 果 了 是 1(2) 的 ， 
那么 了 的 二 阶 差分 AY, 是 平稳 的 :如果 Y 了 ,是 (0) ,那么 了 是 平稳 的 。 
单 整 阶 数 在 重要 概念 H 4 中 总 结 。 


重要 概念 14. 4 





单 整 阶 数 、. 关 分 和 平稳 性 
Bin Y, 是 一 阶 单 整 的 , 即 如 果 Y, 是 1(1) 的 ,那么 了 有 一 个 单位 自 加 归根, 而且 它 的 
一 航 差 分 AY, 是 平稳 的 。 
国 如 果 v, 是 二 阶 单 整 前 , 即 如 果 Y, 基 J2) 的 ,那么 AY 有 一 个 单位 自 回归 根 ,而 且 它 


的 二 阶 差分 a Y, 是 平稳 的 。 
Big Y, 是 d 阶 单 整 的 {intergrated of order d, Bl /{d) ) ,那么 了 必须 经 过 d 次 差分 


来 消除 它 的 随机 性 趋势 ,也 就 是 说 ,A"Y 是 平稳 的 。 





Mb PIA AL C 2 0 e 1} 的?” 如果 了 是 12) 的 ,那么 AY 就 是 71) 的 ， 
因此 AY, 有 一 个 等 于 1 的 自 回 归根 。 然而, 如果 了 是 (1) 的 ,那么 AY, 是 平稳 的 。 所 以 ,Y 
是 1(2) 的 这 一 零 假 设 与 相应 的 1 是 1(1) 的 这 一 备 择 假 设 ,可 以 通过 检验 AY, 是 否 含 有 等 
于 1 的 自 回 归根 来 检验 。 如 果 AY, 有 单位 自 同 归根 的 假设 被 折 绝 ,那么 了 是 1(2) 的 假设 被 
拒绝 ,支持 巴 是 二 1) 的 备 择 假设 。 

KISAA DIY AGE f rE k V Bum EAKA ”在 第 这 章 , 我 们 得 出 这 样 的 结论 ， 
美国 通货 脱 胀 率 似乎 具有 湖 机 游 动 的 随机 性 赵 荔 ,也 就 是 说 ,通货 膨胀 率 是 1(1) 的 。 如 果 
通货 膨胀 率 是 1) 的 ,那么 可 以 通过 一 阶 差分 米 消 除 它 的 随机 性 趋势 ,因此 Alnf 是 平稳 
Hja M—F 12.2 节 {( 公 式 (12.2)) ,以 年 率 表 示 的 季度 通货 膨胀 率 是 价格 水 平 对 数 的 一 
阶 差 分 乘 以 400, 即 mf, =400Ap,, HP p, =infCPL)。 因 而 ,将 通货 膨胀 率 看 做 是 区 1) 的 等 
价 于 将 Ap, 看 做 是 171) 的 ,但 是 反 过 来 这 又 等 价 于 将 p, 看 做 是 (2) 的 。 因 此 ,我 们 自 始 至 
终 都 是 将 价格 水 平 的 对 数 看 做 是 1(2) 的 ,尽管 我 们 一 直 没 有 使 用 这 个 术语 。 

价格 水 平 的 对 数 p, 和 通货 陪 胀 率 绘制 在 图 14 一 1 中 。 价 格 水 平 对 数 ( 图 14 一 1(a)) 的 
长 期 趋势 比 通货 膨胀 率 ( 图 14 一 1(8) ) 的 长 期 趋势 变化 得 更 平滑 。 价 格 水 平 对 数 的 这 个 平 
滑 的 变化 趋势 是 典型 的 天 2) 序 列 。 


14.3.2 单位 根 的 DF-GLS 检验 


本 节 继 续 讨 论 12.6 节 中 关于 单位 自 回 归根 检验 的 问题 。 我 们 先 介 绍 单位 自 回 归根 的 
另 一 种 检验 方法 , 即 所 请 的 DF-GLS 检验 。 接 下 来 ,在 一 个 可 选读 的 数学 还 明 这 一 节 , 我 们 
讨论 了 为 秆 么 单位 根 检验 统计 量 不 最 从 正 态 分 布 ,即使 在 大 样本 条 件 下 。 

DF-CIS 检验 ”ADF 检验 是 一 个 被 最 早 提出 来 的 检验 单位 根 零 假设 的 检验 ,而 且 是 实 
际 中 最 常用 的 检验 。 丰 过 ,其 他 的 检验 随后 被 相继 提出 来 ,它们 中 的 许多 都 比 ADF 检验 有 
更 高 的 功效 ( 见 重要 概念 3.5) 。 当 备 择 假设 为 真 时 ,一 个 具有 比 ADF 检验 更 高 功效 的 检 
验 , 更 有 可 能 拒绝 有 单位 根 这 一 零 假 设 ( 育 列 是 平稳 的 备 择 假 设 ) ,因此 ,一 个 功效 更 强 的 检 
验 有 能 力 更 好 地 将 单位 AR 根 和 数值 接近 于 1 但 小 于 1 的 根 区 分 开 来 。 

本 节 讨 论 由 Elliott, Rothenberg 和 Stock (1996) 提 出 的 DF-GLS 检验 {DF-GLS test) 。 
这 个 检验 是 针对 这 样 的 情 视 引入 的 ,在 零 假 设 下 ,7 具有 随机 游 动 趋势 ,可 能 含有 漂移 项 ， 
而 在 备 择 假 设 下 ,Y, 围绕 一 个 线性 时 间 赵 势 是 平稳 的 。 

DF-GLS 检验 分 两 步 计算 。 第 一 步 ,用 广义 最 小 二 胰 法 (GLS, 见 13.5 节 ) 估计 截 忠和 趋 
势 ,通过 计算 3 个 新 的 变量 VX 和 ,来 进行 GLS 估计 ,这 里 ,VV =Y,,V, =Y, - a" Y, ,t= 
2 ,TE 1 -1), 这 里 用 公式 =l- 
13.5XT 计算 ma* 。 然 后 用 对 加, 和 总 ,进行 回归 ,总体 回 归 方程 的 系数 用 OLS 估计 ,使 用 
=1,…, 了 的 观测 值 。 

V, = 5 X,, +8,X, +e, (14.20) 
其 中 ,e 是 误差 项 。 注意, 公式 (14. 20) 的 回归 中 没有 截 距 项 ,于 是 ,用 OLS fiit ó, Mô 
计算 了 的 “去 趋势 ", 即 下 = 了 - (Š +5,)。 

第 二 步 ,用 迪 基 一 富 勒 检验 方法 来 检验 六 中 的 单位 自 回归 根 , 这 里 的 迪 基 一 富 勤 回 归 
不 包括 截 中 项 和 时 间 趋 势 。 也 就 是 说 ,用 AF 对 站 .和 AY I. AY Bila P E Rus 
常 一 样 , 注 后 阶 数 p 的 确定 取决 于 专业 知识 ,或 使 用 12.5 节 中 所 讨论 的 基于 数据 的 方法 , 即 
AIC 和 BIC 准则 。 
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注 :价格 对 数 的 趋势 [ 见 图 14 一 1(a) ) 比 遂 货 脱 胀 率 的 趋势 ( 见 图 RER 
图 1 一 !。 美 欧 价 格 水 平 的 对 数 和 通货 脱 胀 率 {11960…-2000》 

如 果 备 摊 假 设 是 “F 是 平稳 的 ”, 且 含有 非 零 的 均 信 ,但 不 合 时 间 趋 势 , 那 么 前 面 的 步 梭 
就 需要 修正 。 具 体 来 潮 , 用 公式 ae" =1 -ITHE a ,省 略 轿 妇 方 程 {14. 20) 中 的 变量 站， 
序列 Y: RRN Y =Y, -8 

DF-GLS 检验 第 一 步 中 的 GES BI ix ikisi ttt AU ADF 检验 草 吉 复 亲 ,但 
也 芷 是 它 的 这 个 特点 使 它 改进 了 区 分 单位 自 轿 妇 根 零 假设 和 也 是 平稳 的 备 择 翁 设 的 能 力 。 
这 个 改进 证 能 是 实质 性 的 。 例 如 ,假设 Y, 实际 上 是 一 个 平稳 的 AR(1) ,其 自 同 归 和 系数 8 = 
0.95, EA T =200 个 观测 值 , 计 算 一 个 设 有 时 间 趋 势 的 单位 要 检验 ( 印 将 :排除 在 迪 基 一 窗 
舱 加 归 之 外 ,省 阁 公 式 {14.20) PAI A) ,那么 ABF 检验 在 3 名 的 显著 性 水 平王 正确 拒绝 等 
很 设 的 概率 的 为 31% W DBF-GLS RIMAR ETS, 


DF-CLS 检验 的 临界 位 ”由 于 在 ADF 和 DF-GLS 检验 中 确定 性 项 的 系数 用 不 同 的 方法 
估计 ,因此 这 两 个 检验 具有 不 同 的 临界 值 。 表 14 一 1 给 出 了 DE-GLS 检验 的 临界 值 。 如 果 
DF-GLS 检验 统计 量 ( 第 二 步 回归 中 Y) ,的 + 统计 量 ) 小 于 该 临界 值 ,那么 只 有 单位 根 的 零 
假设 被 拒绝 。 像 迪 基 一 富 勒 检验 的 临界 值 一 样 , 适 当 的 临界 值 取决 于 使 用 何 种 形式 的 检验 ， 
即 取决 于 是 否 包含 时 间 趋 势 (如 ,是 否 包含 在 公式 (14.20) 中 ) 。 





表 14 一 ] DF-GLS 检验 的 临界 估 
a FEI HA f 
CACA 20) 中 的 所 山内 子 ) 10% 5% 1% 
RERET HA X,) -1.62 -1.95 -2,58 
ARRET AHAS A A X) -2,57 -2,89 -3.48 


资料 来 源 :Fuller( 1976) ; Elliott, Rothenberg $ Stock( 1996,4% 1), 

EA t EK Er Ayni 。 当 AY 的 三 阶 滞后 包含 在 第 二 和 阶段 的 迪 基 一 富 勒 回归 中 
时 ,在 1962: 工 到 1999; V BB B] *F CPI 通货 膨胀 率 mf. 所 计算 的 DF-GLS 统计 量 的 值 是 
~1.98。 这 个 值 刚好 小 于 表 14 一 1 中 的 5 多 临界 值 -1.95, 所 以 利用 具有 3 阶 滞后 的 DF-GLS 
检验 导致 了 在 5 名 的 显著 水 平 下 拒绝 单位 根 零 假 设 。 三 稚 滞后 的 选择 是 基于 AIC( 在 6 个 
滞后 中 选 出 最 太 值 ) 做 出 的 ,在 此 情况 下 所 选择 的 清 后 阶 数 磁 巧 与 BIC 选择 的 滞后 阶 数 
相同 。 

因为 DF-GLS 窒 验 有 能 力 更 好 地 区 别 单位 根 的 零 假设 和 平稳 性 的 备 择 假设 ,所 以 ,这 个 
发 现 的 一 种 解释 就 是 通货 膨胀 实际 上 是 平稳 的 ,但 在 12.6 节 所 进行 的 迪 基 一 宣 勒 检验 却 没 
能 发 现 这 一 点 (在 5 名 的 水 平 下 ) 。 不 过 ,应 该 注意 的 是 ,DF-GLS 检验 是 否 会 拒绝 零 假 设 , 在 
本 例 中 ,对 滞后 长 度 的 选择 是 敏感 的 ,因此 应 该 对 上 述 结论 保持 警惕 。 如 果 该 检验 以 四 阶 洁 
后 为 基础 ,那么 它 在 10 名 的 水 平 下 拒绝 了 零 候 设 , 但 在 5% 的 水 平 下 却 没有 拒绝 零 假 设 ; 如 
果 它 以 二 阶 滞后 为 基础 , 则 它 在 10 多 的 水 平 下 也 没有 拒绝 零 假设 。 该 结论 对 样本 的 选择 也 
是 敏感 的 ,如 果 该 统计 量 是 在 1963; 工 到 1999 , 丈 期 间 计算 的 (如 正好 去 掉 第 一 年 ) , 则 该 检 
验 在 10 锡 的 水 平 下 拒绝 零 假 设 , 但 在 5 六 的 水 平 下 不 拒绝 零 假 设 。 因 此 ,总 体 的 描述 是 相当 
模棱两可 的 { 因为 如 在 公式 (12. 34) 之 后 所 讨论 的 , 它 是 以 ADF 检验 为 基础 的 ) ,需要 预测 
者 对 将 通货 膨胀 建 模 为 天 1) 的 形式 还 是 建 模 为 平稳 的 形式 这 个 问题 做 出 理性 的 判断 。 


14.3.3 ”为 什么 单位 根 检验 具有 非 正 态 分 布 


在 12.6 节 中 强调 ,如 果 回 归 因 子 是 非 平稳 的 ,那么 回归 分 析 强 烈 依赖 的 大 样本 正 态 分 
布 息 设 就 不 适用 。 在 回归 包含 单位 根 的 零 假 设 下 , 迪 基 一 富 勤 回归 中 的 回归 因子 y, (PLE 
在 DF-GLS 检验 第 二 步 中 修正 的 迪 基 一 富 勒 回归 里 的 回归 因子 Y...) 是 非 平 稳 的 。 单 位 根 
榨 验 统计 量 的 非 正 态 分 布 就 是 这 个 非 平 稳 性 的 后 果 。 

为 了 从 数学 上 更 深入 地 理解 这 个 问题 ,考虑 一 个 可 能 是 最 简单 的 迪 基 一 高 勒 回归 ,在 这 
个 回归 中 ,用 AY, 对 单个 回归 因子 了 -进行 回归 ,将 截 相 排除 在 外 。 用 重要 概念 12.8 中 的 


符 导 ,这 个 回归 的 OLS 估计 量 为 # = > Y. AY, 之 Yao TE: 


(14.21) 








过 用 一 个 序列 减 去 另 一 个 序列 划 除 了 每 个 单独 序列 中 的 趋势 ,所 以 这 两 个 序列 必然 具有 相 
洁 的 趋势 ,也 就 是 说 ,它们 必定 拥有 共同 的 随机 性 趋势 。 

T Ë rit 

20 三 





1 年 期 利率 





1960 195 1970 1975 1980 1985 1990 195 2000 
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注 :] 年 期 和 3 个 月 期 利率 拥有 共同 的 随机 性 趋势 。 这 两 种 利率 之 间 的 利 差 或 差分 没有 表现 出 趋 
势 。 这 两 种 利率 看 上 去 是 协 整 的 。 
图 14 一 2 1 年 期 利率 .3 个 月 期 利率 和 利 姜 


两 个 或 两 个 以 上 拥有 共同 随机 性 趋势 的 序列 被 称 作 是 协 整 的 { comtegrated) o UPEA 
正式 定义 (应 归于 Granger,1983 ) 在 重要 概念 14. 5 中 给 出 。 在 本 节 中 ,我 们 介绍 一 种 检验 协 piae 
整 是 否 存在 的 方法 ,讨论 与 协 整 变量 有 关 的 回归 系数 的 估计 ,并 举例 说 明 协 整 关系 在 预测 中 
的 应 用 。 讨 论 一 开始 主要 集中 于 只 有 两 个 变量 区 和 了 , 的 情况 。 QK a 


重要 概念 14. 5 


H 整 
假设 五 和 了 是 一 阶 单 整 的 ,如 果 对 于 某 些 系数 9,7, ~ 0X, 是 蕉 阶 单 整 的 ,那么 就 说 蕊 
和 是 协 整 的 {cointegrated) 。 系 数 上 0 被 称 为 协 整 系数 {cointegrating coefficient), 
MEX, 和 了 BHRR, BACARAR RARE. HAE Y. - 8X, 
可 以 噜 除 这 个 共同 的 随机 性 趋势 。 
MERX ERO, SAADE, RIDESHARE AY, CART 0) EE Y, P 
的 随机 性 趋势 。 在 时 间 序 列 回 归 中 ,通过 使 用 AY, 代替 Y, 就 避免 了 由 随机 性 趋势 所 引起 的 
HE. Rt WRX, 和 了 是 协 整 的 ,那么 噜 除 趋势 的 男 一 种 方法 是 计算 差 值 了 .~ 级,。 由 于 
Y, - 0X, 项 是 平稳 的 ,因此 它 也 能 用 在 回归 分 析 中 。 
实际 上 WE X, MY, 尾 协 整 的 ,那么 可 用 VAR Æ X, 和 了 的 一 阶 差分 模型 ,并 通过 
将 了 - X, 作为 额外 的 回归 因子 来 扩展 回归 方程 。 
AY, =ñ + BAY | + +B Y, +y ÀX... +". 
+y AX... +a lY, -0X,.. ) +u, (14.24) 
AX, =8x +Ba AY, + +B, AY... + yn ÀX + 
+ yp A, + oY 8K, 1) +u, (14.25) 





saa :usequqellcdaisñed 











Y, - 0X TAPAR EEIE IN {error correction term) 。 公 式 (14.24) 和 公式 (14.25) 中 
合并 的 模型 被 称 为 向 量 误差 修正 模型 {vector error correction modei, 简写 为 VECM) 。 在 
VECM 中 ,了 - 8@X, 的 过 去 值 冯 助 于 预测 AY, 和 /或 AX, 的 未 来 值 。 


14.4.2 如 何 判断 两 个 变量 是 否 是 协 整 的 


确定 两 个 变量 是 否 可 以 合理 地 建立 为 协 整 模型 有 三 种 方法 :使 用 专业 知识 和 经 济 理论 ; 
绘 出 序列 图 形 , 并 观察 它们 看 上 去 是 否 拥有 共同 的 随机 性 趋势 ;执行 协 整 统计 检验 。 实 践 中 
这 三 种 方法 都 应 该 使 用 。 

首先 ,你 必须 使 用 你 对 这 些 变量 的 专业 知识 来 确定 协 整 的 存在 是 否 确实 是 合理 的 ， 例 
如 ,图 14 一 2 中 的 两 个 利率 被 所 谓 的 利率 期 限 结构 的 预期 理论 联系 在 一 起 。 根 据 这 个 理论 ， 
1 年 期 国债 在 1 月 1 日 的 利率 是 90 天 短期 债券 在 该 年 第 一 季度 的 利率 和 在 该 年 第 二 季度 、 
第 三 季度 及 第 四 季度 所 发 行 的 未 来 90 天 短期 债券 的 预期 利率 的 平均 值 。 如 果 不 是 这 样 的 ， 
那么 投资 者 就 能 够 预期 通过 持 有 1 年 期 国债 或 连续 4 期 的 90 天 短期 债券 来 赚钱 ,他 们 会 抬 
高 债券 的 价格 直到 预期 收益 相同 。 如 果 这 种 9 天 利率 其 有 随机 游 动 的 随机 件 趋 势 ,那么 这 
个 理论 意味 着 ,这 个 随机 性 趋势 被 1 年 期 利率 所 继承 ,这 两 种 利率 之 差 ( 即 利 差 ) 是 平稳 的 。 
因此 ,期 限 结构 的 预期 理论 意味 着 ,如 果 该 利率 是 1(1) 的 ,那么 它们 将 是 协 整 的 ,相应 的 苏 
整 系数 8=1( 见 练习 14.2)。 

其 次 ,直观 审视 序列 的 图 形 , 有 助 于 确认 存在 协 整 的 证 据 。 例 如 , 图 14 一 2 中 的 两 个 利 
率 图 显示 ,每 个 序列 看 土 去 都 是 11) 的 ,但 利 差 看 上 去 却 是 1(0) 的 ,因此 这 两 个 序列 看 于 去 
是 协 整 的 。 

青 次 ,迄今 为 止 我 们 所 介绍 的 单位 根 检 验 的 方法 也 可 以 被 扩展 到 协 整 检验 。 这 些 检 验 
所 依据 的 核心 观点 是 ,如 果 Y, A X, 是 协 整 的 , 协 整 系数 是 ,那么 Y, - 0X, 是 平稳 的 ;否则 ， 
Y, - 0X, 是非 平稳 的 (是 1(1) 的 )。 因 此 ,可 以 遂 过 检验 了 - ox, 有 单位 根 这 一 零 假设 来 检验 
Y, 和 和 XX, 不 是 协 整 的 ( 即 了 -既是 1) 的 ) 假 设 ; 如 果 这 个 假设 被 拒绝 ,那么 就 可 以 将 和 
X, 建 模 为 协 整 的 。 这 个 检验 的 细节 依赖 于 协 整 系数 8 是 否 是 已 知 的 。 

首相 己 知 时 泌 歼 的 检 和 在 一 些 情况 下 ,专业 知识 或 经 济 理论 可 以 指明 4 的 值 。 当 8 
已 知 时 , 迪 基 一 富 朝 和 DF-GLS 单位 根 检验 可 被 用 来 检验 协 整 。 首 先 构造 序列 z, = Y, - 6X,， 
然后 检验 z 有 单位 自 回归 根 的 零 假 设 。 

“a AMIERT E. WEHR 8 是 未 知 的 ,那么 在 检验 误差 修正 模型 中 的 单 
位 根 之 前 必须 先 估计 它 。 这 个 初始 步骤 使 得 随后 的 单位 根 检验 有 必要 使 用 不 同 的 临界 值 。 

具体 来 说 ,第 一 步 , 协 整 系数 8 用 回归 的 OLS 佑 计 方 法 进行 估计 。 

Y. = w + 0X, + z, (14.26) 

第 二 步 , 迪 基 一 富 勒 :检验 ( 含 截 距 项 ,但 无 时 间 趋 势 ) 被 用 于 检验 这 个 回归 残 差 z, 的 单 
位 根 。 这 个 两 步 法 被 称 为 恩格尔 一 烙 兰 杰 增 项 的 迪 基 一 富 勒 协 整 检验 或 EG-ADF 检验 
(test tor EG-ADF ) ( Engle 与 Granger, 1987) 

EG-ADF 检验 统计 量 的 临界 值 在 表 14 一 2 中 给 出, 了 第 一 行 的 临界 值 只 适用 于 公式 
(14. 25) 中 有 单个 回归 因子 的 情形 ,因此 存在 两 个 协 整 变量 (X, 和 YY.)。 随 后 各 行 中 的 值 送 
用 于 多 个 苏 整 变量 的 情况 , 它 在 本 节 最 后 讨论 。 





# 14— 书 的 临界 FARAT Poler 7) Phillipa FA Quana t1990) HE Hanen 1992) 的 建议 , 表 14 一 2 中 的 
ERENER, s| fE iË: X, 和 了 是否 含有 成 分 ， 这 些 临 


表 14 一 3 两 种 利率 的 单位 根 积 协 整 检 验 统计 量 














tyi WDF 统计 全 DE 26031 i 
RI - 2.96” -1.88* 
Rlyr -2,22 -1.37 
Riy — R90 -6.31 * -5. 59" 
Rlyr - 1. 46 R90 -6.97" — 


注 ;R90 是 以 年 利率 表示 的 美国 90 天 短期 债券 利率 ,而 Ry 是 1 年 期 美国 国债 利率 。 使 用 1962; 到 
1999; 订 期 间 的 季度 数据 估计 回归 。 在 单位 根 检验 统计 量 回归 中 ,根据 AIC( 六 阶 计 后 中 最 大 的 一 个 ) 来 先 
择 洁 后 阶 数 。 单 位 根 检验 统计 景 在 "10%， 5% 或 "1% 的 显著 性 水 平 下 是 显著 的 。 

这 个 值 被 强行 使 用 时 误差 修正 项 是 0) 的 ( 即 利 差 是 平稳 的 ), 所 以 原则 上 不 必 使 用 EG- 
ADF 检验 (8 是 用 这 个 检验 信 计 的 )。 尽 管 如 此 ,为 了 进行 说 明 , 我 们 还 是 计算 了 这 个 检验 。 
EG-ADF 检验 的 第 一 步 , 是 用 一 个 变量 对 另 一 个 变量 的 OLS 回归 估计 8, 结果 是 : 


— 
Rlyr= Ü. 361 + 1. 046FR90, ,FR = 0. 973 (14.28) 


35 — zy k + EL H202 z, 的 ADF 统计 量 。 其 结果 (在 表 4—3 的 最 后 一 行 ) 小 于 
表 14 一 2 中 给 出 的 1 各 临界 值 -3. 站 ,所 以 ,2 含有 单位 自 回 归根 的 零 假 设 被 拒绝 。 这 个 统 
计量 也 指出 了 应 将 这 两 种 利率 看 做 是 协 整 的 。 注 意 ,公式 (14. 28 中 没有 给 出 标准 误 , 因 为 
如 上 文 所 讨论 的 , 协 整 系数 的 OLS 估计 量具 有 一 个 非 正 态 分 布 , 它 的 :统计 量 也 不 是 正 态 分 
布 的 ,所 以 给 出 标准 误 (HAC 或 其 他 的 ) 会 造成 误导 。 

ABEP PERIE iR A ER, A FY, AA, 是 协 整 的 ,那么 AY, 和 AX, 的 预测 ,可 
以 通过 使 用 误差 修正 项 的 滞后 值 增加 一 个 AY, 和 AX, BJ VAR 来 改进 ,即使 用 公式 (14. 24) 
和 公式 (14. 25) 中 的 YECM 来 计算 预测 值 。 如 果 9 是 已 知 的 ,那么 YECM 的 未 知 系数 可 用 
OLS 进行 估计 ,把 xs = Y, 一 级 ,包括 进来 作为 一 个 增加 的 回归 因子 。 如 果 ## 是 未 知 的 ， 
那么 YECM 可 将 了 作为 一 个 回归 因子 进行 估计 ,这 里 的 2 = 下 -就 ,, 其 中 8 是 0 的 一 个 估 
HE. 

在 对 这 两 种 利率 的 应 用 中 ,理论 建议 8=1, 单 位 根 检验 也 支持 将 这 两 种 利率 建 模 为 协 
整 系数 为 1 的 协 整 关系 。 因 此 ,我 们 用 理论 所 建议 的 值 6=1 设 定 YECM, 即 通过 将 利 差 的 
洪 后 值 Rlyr，, -~ R90,.1 增 加 到 变量 AR1yr, 和 AR90, 的 VAR 模型 中 来 设 定 YECM 模型 。 用 
一 阶 差分 的 二 阶 潜 后 来 设 定 ,所 得 的 VECM 为 ， 


— 
ÀR90 = 0.14 -024A190 1- 0.44AR90,..,- 0014Rl1yr 





(0.17) (0.32) (0.34) (0.39) 
+ Q 15AR1yr_,—- 0. I8(R]z_, - R90._,) (14.29) 
(0.27) (0.27) 
— 
ARIyr= 0.36 - 014AR90, - 0.33AR90, ,~ Q. THARIyr,_, 
(0.16) (0.30) (0.29) (0.35) 
+ O. 10AR1yr, 2s— 0.52(Rl1yr_, ~ R90,_,) (14.30) 


(0.25) (0.24) 
在 第 一 个 等 式 中 ,没有 一 个 系数 在 5% 的 水 平 下 是 单独 显著 的 ,而且 滞后 的 利率 一 阶 关 
分 的 系数 在 5 名 的 水 平 下 也 不 是 联合 显著 的 。 在 第 二 个 等 式 中 ,这 个 滞后 的 一 阶 善 分 的 系 
数 不 是 联合 显著 的 ,但 滞后 简 差 {误差 修正 项 ) 系数 的 估计 值 为 -0.52,: 统计 量 为 -2.17， 








所 以 它 在 59% 的 水 平 下 在 统计 上 是 显著 的 。 尽 管 利率 一 阶 差 分 的 滞后 值 对 预测 未 来 利率 是 
无 用 的 ,但 猎 后 的 利 差 确实 有 助 于 预 漠 1 年 期 债券 利率 的 变化 。 当 1 年 期 利率 高 于 90 KH 
率 时 , 据 预 测 ,1 年 期 利率 将 来 会 下 降 。 


4.5_ 条 件 寞 方差 . 


有 时 候 稳 定 而 有 时 候 不 稳定 这 种 现象 一 即 波动 以 集 洁 的 形式 出 现 一 一 经 常 出 现在 许 
多 经 济 时 间 序 列 中 。 本 节 提 出 了 量化 波动 集 阳 { volatility clustering) 的 一 对 模型 ,也 就 是 众 
所 周知 的 条 件 异 方差 Tcondltienal heteroskedasticity) 模型 。 


14.5.1 波动 集聚 (volatility clustering) 


12.7 节 有 一 个 奇怪 的 实证 结果 :用 四 阶 滞后 的 菲 利 浦 斯 曲线 所 生成 的 从 1996 年 到 
1999 年 通货 膨胀 的 伪 样 本 外 预测 的 均 方 根 预测 误差 为 0. 75 个 百分点 ,而 生成 这 些 预 测 值 
的 OLS 回归 的 标准 误 为 1.47。 也 就 是 说 ,样本 外 误差 只 是 样本 内 误差 的 一 半 ! 面 对 这 样 乐 
观 结果 的 预测 者 ,当然 他 或 她 的 客户 会 感到 满意 。 不 过 ,预测 这 件 事 是 否 也 是 有 时 容易 有 时 
难 呢 ? 20 世纪 90 年 代 后 期 正 是 那些 容易 的 时 期 之 一 吗 ? 

根据 对 绘制 在 图 14 一 3 中 的 四 阶 灌 后 的 非 利 浦 斯 曲线 残 差 图 的 审视 ,可 以 得 出 一 些 结 
论 : 这 些 残 差 表现 出 波动 集聚 现象 。 在 320 世纪 70 年 代 后 期 和 80 年 代 早期 ,绝对 预测 误差 
常常 超过 2 个 百分点 。 可 是 ,在 20 世纪 6 年代 和 0 年 代 ,绝对 预测 误差 典型 地 小 于 1 个 
百分点 。 

外 到 分 比 
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注 ; 菲 利 浦 斯 曲线 的 残 差 表现 出 波动 集聚 现象 。 在 20 世纪 60 FRA 90 ERRER B, ü 
在 20 世纪 0 年代 各 年 代 波 动 性 相对 较 高 。 
B 14 一 3 ”公式 (14,5) 中 菲 利 浦 斯 曲线 的 残 差 

波动 集聚 现象 在 许多 金融 时 间 序 列 中 是 司空 见 惯 的 。12. 2 节 中 所 讨论 的 一 个 例子 显 
示 在 图 12—2( d) 中 ,这 是 一 个 从 1990 年 到 1998 年 NYSE 股票 综合 指数 的 1 771 个 日 收益 
图 。 平 均 来 看 ,1991 年 和 1998 年 的 绝对 里 百分比 变化 比 1994 年 和 1995 年 大 。 在 任何 给 定 





的 年 份 里 ,一 些 月 份 总 比 另 一 些 月 份 具 有 更 天 的 波动 性 。 像 菲 利 浦 斯 曲线 的 残 差 一 样 ,这 些 
价格 的 百分比 变化 具有 扩展 的 高 波动 性 时 期 和 扩展 的 相对 稳定 时 期 。 

波动 集聚 可 被 看 做 是 误差 项 的 方差 随时 间 变 化 存在 集聚 现象 :如 果 回 妇 误差 在 一 个 时 
期 里 具有 较 小 的 方差, 那么 在 下 一 个 时 期 里 它 的 方差 也 倾向 于 是 较 小 的 。 换 名 话说 ,波动 集 
聚 意味 着 误差 表现 出 随时 间 变化 的 异 方 差 。 


14.5.2 ” 自 回 归 条 件 异 方差 


波动 集聚 的 两 个 模型 是 自 回 归 条 件 异 方差 (ARCH) 及 其 扩展 形式 , 即 广 义 ARCH 
(GARCH) 模 型 。 

ARCH 模 剧 。 考 虚 ADL(1,1) 回 归 : 

Y =B +B F, +A, a +u, (14.31) 
在 ARCH 模型 (由 经 济 计量 学 家 Robert Engle( Engle ,1982) 提出 ) 中 ,将 误差 项 u, 建立 为 服 
从 均值 为 0 .方差 为 o? 的 正 态 分 布 模型 ,这 里 oz 取决 于 un 过 去 值 的 平方 。 具 体 来 说 ,表示 
为 ARCH(p) 的 p Ër ARCH 模型 是 : 
or = y tau., + ty + + ow, (14.32) 
其 中 ,mm ,Qa ,… ,mw 是 未 知 系数 。 如 果 这 些 系数 都 是 正 的 ,如 果 近 期 的 平方 误差 很 天 ,那么 
ARCH 模型 预测 的 当前 的 平方 误差 在 幅度 十 也 将 会 很 大 ,也 即 它 的 方差 o; 很 大 。 

尽管 这 里 所 描述 的 是 公式 (14. 31) 中 的 ADL(1,1) 模 型 ,但 ARCH 模 弄 可 被 应 用 于 任何 
误差 项 具有 条 件 零 均值 的 时 间 序 列 回 归 模 型 的 误差 方差 分 析 , 包 括 更 高 阶 的 ADL 模型 A 
回归 和 含有 多 个 预测 因子 的 时 间 序 列 阿 归 。 

CARCH 异型 。 由 经 济 计 量 学 家 Timothy Bollerslev(1986) 提 出 的 广义 ARCH( GARCH) 
RAHET ARCH 模型 ,使 oi 既 依 赖 于 它 自身 的 沾 后 值 , 又 依赖 于 平方 误差 的 沸 后 值 。 
GARCH(p,q) 模 型 为 ; 

Ti =00 taula + 十 名 中- thra + +AT (14.33) 
其 中 ,ao el appo $, 是 未 知 系数 。 

ARCH 模型 类 似 于 一 个 分 布 滞后 模型 ,而 GARCH 模型 类 似 于 -个 ADL 模型 。 如 在 附 
录 13.2 中 所 讨论 的 ,ABL 模型 (在 恰当 的 时 候 ) 能 够 提供 一 个 比分 布 泪 后 模型 更 简化 的 动 
AEREN, EE ,通过 加 人 o? 的 滞后 项 ,GARCH 模型 能 够 用 比 ARCH 模型 少 的 参数 捕 
担 到 方差 的 缓慢 变化 。 

ARCH 模型 和 GARCH 模型 一 个 重要 的 应 用 ,是 测度 和 预测 金融 资产 收益 率 随 时 间 变 
化 的 波动 性 ,尤其 是 在 很 高 抽样 频率 下 所 观测 到 的 资产 ,如 图 12 一 2(d) 中 的 日 股票 收益 率 。 
在 这 类 应 用 中 ,经常 将 收益 率 本 身 建 模 为 不 可 预测 的 ,所 以 公式 (14. 31) 中 的 回归 只 包括 截 
EH, 

估计 和 惟 断 。ARCH 模型 和 GARCH 模型 用 极 大 似 然 法 ( 见 附录 9.2) 估 计 。ARCH 和 
CARCH 系数 的 估计 量 在 大 样本 条 件 再 服从 正 态 分 布 ,因此 ,大 样本 条 件 下 的 上 统计 量 航 从 
标准 正 态 分 布 ,系数 的 置信 区 间 可 以 构造 为 它 的 最 大 似 然 估计 £1. 96 伴 标 准 误 。 


14. 5.3 ”应 用 于 通货 膨胀 预测 


公式 (14.5) 中 用 OLS 估计 的 四 阶 滞后 的 菲 利 浦 斯 曲线 对 相同 时 期 的 误差 项 用 
CARCH(1,1) 模 型 重新 估计 ,得 到 : 








人 








— 
Ar- 129 -04ARF -03IARF + 002AF -0.09A8 
(0.33) (0.10) (0.09) (0.11) (0.09) 


~ 2, 50Unemp, 1+ 2.76Unemp, + 0. 15Unemp,.,— 0. G4Unemp, a 


(0.34) (0.71) (0.81) (0.40) (14.34) 


F= 0.26 + 0.470) + 0.450, 
(0.14) (020) (0.17) 

GARCH 模型 中 的 两 个 系数 (或 ,和 ct 的 系数 ) 在 5% 的 显著 性 水 平 下 在 统计 鞋 都 是 
单独 显著 的 ,而 且 两 个 系数 都 为 0 的 联合 假设 在 5% 的 显著 性 水 平 下 也 被 拒绝 。 因 此 ,我 们 
能 够 在 菲 利 浦 斯 曲线 的 误差 是 条 人 忻 异 方差 的 备 择 假 设 下 拒绝 它们 是 同方 差 的 零 假设 。 

用 OLS 估计 的 ADL 系数 (公式 (14.5) ) 和 用 极 大 似 然 估计 的 带 有 GARCH 模型 的 系数 
(公式 (14. 34)) 稍 微 不 同 。 如 果 公 式 (14. 35) 中 的 两 个 GARCH 系数 确实 为 0, 那 么 这 两 组 
估计 值 将 会 是 相同 的 。 不 过 , 这些 系 数 都 不 是 零 ,因为 极 大 似 然 估计 同时 估计 了 公式 
(14. 34) 和 公式 (14. 35) 中 的 系数 ,所 以 这 两 组 所 估计 的 ADL 系数 是 不 同 的 。 

预测 方差 o; 能 够 用 公式 ( 14. 35 ) 中 的 系数 和 公式 {14.34) 中 的 残 差 来 计算 。 这 些 残 
差 ,连同 基于 GARCH(1,1) 模 型 如 减 一 个 预测 标准 差 (由 上 z, ) 的 波动 带 一 起 被 绘制 在 图 
14 一 4 中 。 这 些 波 动 带 量 化 了 菲 利 浦 斯 曲线 随时 间 变 化 的 波动 范围 。 在 20 世纪 80 年 代 的 
早期 ,这 些 条 忻 标准 差 的 波动 带 是 较 宽 的 , 表 肖 了 那 时 在 非 利 浦 斯 曲线 回归 误差 中 存在 相当 
大 的 波动 性 ,进而 作为 所 得 到 的 通货 膨胀 预测 有 相当 大 的 不 确定 性 。 但 在 20 世纪 60 年 代 
后 期 和 90 年 代 后 期 这 些 流 动 带 变 得 较 罕 了 ， 

FEME 


(14.35) 





1960 1965 1970 1975 1980 1985 1990 1995 2000 
Ep 


注 :用 公式 (14 35) SHAR +e, 的 GARCH(1,1) 波 动 带 在 条 忻 方差 很 小 时 是 旁 的 ,而 在 条 件 方差 
很 大 时 是 宽 的 。e, 在 畔 本 的 开始 期 和 结尾 期 较 小 ,此 时 的 预测 区 条 也 较 座 。 
图 14 一 4 公式 {14. 34} 中 菲 利 清 斯 曲线 的 残 整 和 CARCH{1,1) 波动 带 
由 于 掌握 了 这 些 条 件 标准 差 波 动 带 ,我 们 现在 可 以 回 到 本 节 开 头 的 问题 土 来 了 :就 预测 通 
KERTA ,20 世纪 90 年 代 是 个 异常 的 稳定 时 期 吗 ? 所 估计 的 条 件 方差 表明 它 确 实 是 这 样 
的 。 例 如 ,在 1993 :到 预测 的 标准 差 为 rws = 人 多, 大 大 小 于 公式 (14.5) 中 回归 的 OLS 标准 


课 1.47。 实 际 的 伪 样 本 外 RMSFE 为 0.75, 仍 小 于 GARCH 估计 值 0.97, 但 不 是 小 得 很 多 。 
-14.6 结论 - 


本 书 的 这 部 分 涵盖 了 时 间 序列 回归 中 一 些 最 常用 的 工具 和 概念 。 分 析 经 济 时 间 序 列 的 
许多 其 他 方面 的 工具 也 已 为 具体 的 应 用 设计 出 来 。 如 果 你 对 了 解 更 多 的 经 济 预 测 感 兴趣 ， 
请 见 Enders( 1995) 和 Diebold(2000) 的 导论 性 的 教科 书 。 对 时 间 序列 数据 更 高 级 、 更 现代 和 
更 全 面 的 经 济 计 量 学 处 理 ,请 见 Hamilton (1994) 。 


1. 向 量 自 回 归 将 天 个 时 间 序 列 变量 的 向 量 建 模 为 每 个 时 间 序 列 依赖 于 它 自 身 的 滞后 
值 和 其 他 大 -1 工 个 序列 的 滞后 值 。 由 VAR 模型 所 生成 的 每 个 时 间 序 列 的 预测 都 是 相互 一 臻 
的 ,因为 它们 是 以 同样 的 信息 为 基础 的 。 

2. 往 前 两 期 或 更 多 期 的 预测 ,可 通过 送 代 向 前 一 步 模 型 (AR 或 VAR) 或 估计 一 个 往 前 
多 期 的 回归 来 计算 。 

3. 两 个 拥有 共同 随机 性 趋势 的 序列 是 协 整 的 ,也 就 是 说 ,如 果 半 和讯 是 (1), 但 7 - 
OX, 是 140) ,那么 了 和 XX 是 协 整 的 。 如果 和 XX 是 协 整 的 ,那么 误差 收 正 项 7 — 0X, & 
助 于 预测 AY, 和 /或 AX,。 一 个 向 量 误差 修正 模型 就 是 多 包含 一 个 灌 后 误差 修正 项 的 AY, 
和 AX, 的 VAR 模型 。 

4 波动 集聚 一 一 当 序列 的 方差 在 一 些 时 期 高 而 在 另 一 些 时 期 低 时 一 一 在 经 济 时 间 序 
列 中 是 常见 的 ,尤其 是 在 金融 时 间 序 列 中 。 

5 波动 集聚 的 ARCH 模型 将 回归 误差 的 条 件 方差 表示 为 近期 回归 误差 平方 的 函数 。 
GARCH 模型 将 ARCH 模型 扩展 ,还 包含 了 滞后 的 条 件 方差 项 。 所 估计 的 ARCH 模型 和 
GARCH 模型 生成 的 预测 宽度 区 间 ,依赖 于 最 近期 间 回 归 残 差 的 波动 任 。 








重要 术语 


向 量 自 王 归 (YAR) 多 期 回归 预测 值 选 代 AR 预 测 AIVAR 预测 二 阶 差 分 
KOJOA) 单 整 阶 数 & 阶 单 整 (1(d)) DF-GLS 检验 共同 趋势 误差 修正 项 
向 量 误差 修正 模型 HWE WERS EG-ADF 检验 DOLS 估计 量 波动 集聚 ”条件 
异 方差 ARCH GARCH 


-复习 概念 


14.1 ”一 位 宏观 经 济 学 家 想 要 对 下 列 宏 观 经 济 变量 进行 预测 :CDP ,消费 ,投资 政府 采 
购 .出 口 .进口 .短期 利率 .长 期 利率 和 价格 通货 膨胀 率 。 他 有 每 一 个 变量 从 1970 年 到 2001 
年 的 季度 时 间 序 列 数据 。 他 应 该 估计 这 些 变 量 的 VAR 并 且 将 其 用 于 预测 吗 ? 为 什么 ?你 
能 建议 另 一 种 方法 吗 ? 

14.2 假设 Y 服从 B=0 且 B=0.7 的 平稳 AR{1) 模 型 。 如 果 节 =5 ,那么 了 :的 预测 
值 ( 即 Y...) EED? 对 于 如 =30, 了 ,hi 是 多 少 ? 这 个 让 =30 的 预测 值 对 你 来 说 合理 吗 ? 





14.3 持久 性 消费 收入 理论 的 一 种 形式 ,暗含 着 实际 CDP( 了 ) 的 对 数 和 实际 消费 (0) 
的 对 数 是 协 整 的 ,日 协 整 系数 为 1。 请 解释 你 如 何 通过 绘制 数据 图 和 使 用 统计 检验 来 研究 
这 个 问题 的 含义 。 

14.4 考虑 ARCH EM o =1.0+0.82 。 解 释 为 什么 这 会 导致 波动 集聚 。( 提示 : 当 
ur 1 蜡 常 大 时 会 发 生 什 么 ?) 

14.5 单位 根 的 DF-GLS 检验 比 迪 基 一 富 勒 检验 具有 更 高 的 功效 。 为 什么 要 便 用 一 个 
功效 更 高 的 检验 ? 


练习 


14.1 {Rik Y, RAFTERS ARC AW Y, =B +BY, + u,o 
`a. 证 明 ; 往 前 期 的 了 的 预测 由 了， 上 =u +Ë (Y, -jr) 给 出 ， 其 中 Hy = =x -有 )。 


b 假设 用 天 = Yar. FEX 与 联系 在 一 ERHI W:X, =+ En 


14.2 利率 期 限 结构 的 预期 理论 的 一 种 形式 认为 ,长 期 利率 等 于 未 来 短期 利率 期 望 什 
的 平均 值 加 上 一 个 1(0) 的 期 限 洲 价 。 REK, 设 Rk, 表示 上 期 利率 ,R1, 表示 1 期 利率 ,e 


表示 一 个 (0) 的 期 限 洲 价 ,那么 Rk, -+5 AL, a te, PH RI, ou EE t BAERE t +i HJ 


Ri 值 的 预测 。 假 设 R1, 服从 随机 游 动 , 即 RI, = Rl, +u, 

a. HEB; Rk =Rl,+e,, 

b. HEBH:Rk, 和 1 是 协 整 的 。 协 整 系数 是 多 少 ? 

c 现 假设 ARI =0. SARL, + ,(b) 中 的 答案 会 如 何 变 化 ? 

d. 现 假设 RI =0. 5R1, + uw,,(b) 中 的 答案 会 如 何 变 化 ? 

14.3 {Mig u, 服从 ARCH 过 程 ,o =1.0+0. 5u |。 

"a. É E(ul) = var(u,) H u, 的 无 条 件 方差 。 WEA valu) =2。 

h. 假设 以 BARREA RIER u, 的 分 布 是 N(0,o?)。 如 果 _， =0.2, A Pr(-38 
SIEL? WME u, =2.0, 那 么 有 (~3<<w, 专 3) 又 是 多 少 ? 

14.4 假设 Y 满足 AR(p) 模 型 ,=PBo +BY, + +B,Y, U. tu AP, Ell Y, 
Yap) =0, S Yun SECY ,il Y.) Ü WEF h>p,Y. 6 Bo +B Y, + 
+B,Y, -porro 


14.5 证 明 公 式 (14. 22) 。( 提 示 : 用 EP = F Oa +A ESE- Y f = 
1=| lu] tz] i=l 








T T T 
2 > Y, AY, + $ AF, 并 解 出 之 Y... AY.) 
t= i=l z 


-附录 第 14 章 中 所 使 用 的 美国 金融 数据 | 


像 美国 联邦 储备 银行 所 报告 的 那样 ,3 个 月 期 美国 债券 利率 和 1 年 期 美国 国债 利率 是 
它们 日 利率 的 月 度 平均 值 ,并 转换 成 年 度 基准 。 本 章 所 使 用 的 季度 数据 是 该 季度 最 后 一 个 
月 的 月 度 平均 利率 。 
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回归 分 析 的 经 济 
计量 理论 
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@ 第 16 章 zinns _ ë 








第 = 
一 元 线性 回归 理论 一 


应 用 经 济 计量 学 家 学 习 一 些 经 济 计量 学 理论 是 很 有 必要 的 。 通 过 学 习 经 济 计量 学 理 
论 , 可 以 把 统计 软件 这 个 " 累 盒 子 " 变 为 一 个 方便 灵活 的 工具 和 菠 , 在 面 对 某 一 项 具体 的 任务 
时 ,你 可 以 从 中 随意 选择 你 所 要 用 的 工具 。 掌 担 经 济 计量 学 理论 ,可 以 使 你 理 解 这 些 工 具 工 
作 的 内 在 道理 ,以 及 为 了 司 短 个 工具 发 挥 出 应 有 的 作用 ,需要 满足 哪些 条 件 。 也 许 最 重要 的 
是 ,理解 了 经 济 计量 学 理论 ,可 以 使 你 知道 在 一 项 具体 的 应 用 中 ,什么 时 候 一 项 工具 的 效果 
是 不 好 的 ,什么 时 企 你 应 该 寻求 不 同 的 经 济 计量 学 方法 。 

本 章 介 绍 一 元 线性 回归 的 经 济 计 喇 学 理论 。 我 们 需要 处 理 两 个 问题 。 首 先 , OLS 估计 
量 和 + 统计 量 的 抽样 分 布 的 特征 是 什么 ? 尤其 是 在 什么 情况 下 ,第 4 齐 讲 解 的 统计 推断 【 假 
设 检 验 和 蛙 悦 区 间 ) 是 可 靠 的 ? 其 次 ,在 什么 情况 下 ,在 理论 上 需要 使 用 DOLS? 也 就 是 说 ,在 
件 么 情况 下 它 的 抽样 分 布 具有 较 小 的 方 盖 ? 

本 书 第 1 至 第 4 部 分 描述 的 经 济 计 量 学 方法 普遍 依赖 于 渐 近 分 布 理论 , 即 当 样本 容量 
很 大 时 ,估计 量 和 检验 统计 量 的 抽样 分 布 的 理论 。 全 书 使 用 的 渐 近 通 近 结论 的 突出 优点 是 ， 
它们 在 相当 普遍 的 意义 下 都 是 成 立 的 ,也 就 是 说 ,它们 在 没有 限定 误差 项 服从 特定 分 布 或 没 
有 和 要求 它 们 是 同方 差 的 情况 下 成 立 。 但 是 ,如 时 误差 项 确实 具有 这 样 特殊 的 特征 一 一 尤其 
是 ,如 时 误差 项 是 同方 差 的 ,其 至 更 特殊 地 ,误差 项 是 同方 差 的 且 服 从 正 起 分 布 的 一 一 那 色 
OLS 估计 量 将 会 具有 许多 我 们 所 希望 的 理论 性 质 。 尽 管 这 些 同方 差 或 正 态 分 布 的 过 强 的 假 
设 在 实际 应 用 中 可 能 是 不 现实 的 ,但 是 ,它们 具有 理论 意义 ,因为 它们 允许 我 们 进一步 探索 
OLS 估计 量 的 效果 ,更 深入 地 理解 0LS 回归 。 

本 章 首 先 在 15.1 节 概 述 了 第 4 章 中 已 给 出 的 一 元 回归 模型 ,并列 出 了 本 章 要 用 到 的 所 
有 扩展 的 最 小 二 蓝 假 设 。 前 三 个 扩展 的 最 小 二 萌 假 设 是 重要 概念 4 3 中 的 假设 ,它们 都 是 
渐 近 分 布 理论 所 需要 的 。 因 此 ,这 三 个 假设 在 15.2 节 和 15.3 节 被 用 到 ,而 且 这 里 给 出 了 第 
4 章 中 所 用 到 的 有 关 DIS 估计 量 和 统计 量 的 新 近 结 论 的 数学 解释 。 

一 般 地 说 ,OLS 估计 量 和 上 统计 重 的 精确 分 布 或 育 限 祥 本 分 布 是 非常 复 末 的 。 热 而 ,在 
一 个 特殊 情况 下 ,这 个 精确 分 布 是 相对 简单 的 ,几乎 是 新 近 分 布 的 紧密 的 映 象 。 这 种 情况 会 











重要 概念 15. ! 中 总 结 了 一 元 回归 模型 的 五 个 扩展 的 最 小 二 乘 假设 。 


重要 概念 15.1 


一 元 同 归 的 扩展 量 小 二 乘 假设 

一 元 线性 回归 模型 为 ， 
Y=B +B ,tu isl, en (15.1) 

扩展 的 最 小 二 乘 假设 是 : 
l. E(u,1X,) =0( 条 件 零 均值 ); 
2. (X,Y) ,i=1,…,n, 是 取 自 它们 联合 分 布 的 独立 同 分 布 (1.id. ) 抽 样 ; 
3. (X. ,tu.) 具 有 非 零 的 有 限 的 四 阶 甜 ; 
4. valu, X) =e AFTE); 
5. BEA, 条 件 下 ,u, 的 条 件 分 布 是 正 态 分 布 { 正 态 误 差 项 ) 。 


15.1.2 OLS 佑 计量 
为 了 易于 参考 ,在 这 里 我 们 重新 写 出 B, MA 的 OLS 估计 量 。 


. Yx, -XY -f 
ñ = =— (15.2) 
> -DD)? 
B, = 子 - 房 和 (15.3) 
公式 (15.2) 和 公式 (15.3) 的 推导 见 附录 4- 2。 


[15.2 ” 渐 近 分 布 理 论 的 基本 原理 - 


渐 近 分 布 理论 是 样本 容量 很 大 时 的 统计 量 一 -估计 量 ,检验 统计 量 , 以 及 置信 区 间 
分 布 理论 。 形 式 上 ,这 个 理论 涉及 刻画 一 个 统计 量 沿 着 一 个 更 大 的 样 小 序列 的 抽样 分 布 的 
行为 特征 。 这 个 理论 是 渐 近 的 ,因为 它 刻画 了 当 rn 一 % 时 ,在 极限 状态 下 统计 量 的 行为 
特征 。 

即使 样本 容量 水 远 不 会 是 无 限 的 ,但 渐 近 分 布 理 论 在 经 济 计量 学 和 统计 学 中 仍然 发 挥 
着 重要 的 作用 ,原因 主要 有 两 个 。 第 一 ,如 果 在 一 项 实证 应 用 中 所 使 用 的 样本 观测 期 数 充 分 
大 ,那么 这 个 渐 近 极限 可 以 为 有 限 的 样本 分 布 提供 一 个 高 质量 的 近似 。 第 二 , 渐 近 抽样 分 布 
典型 地 比 精确 的 有 限 样 本 分 布 简 单 得 多 ,进而 在 实际 中 也 更 易于 应 用 。 综 合 考虑 ,这 了 两 个 原 
因 意 味 着 ,可 靠 的 且 寺 接 的 统计 推断 方法 一 一 使 用 :统计 量 的 假设 检验 和 作为 +1.% 售 标 
HERAS 9%5 名 的 置信 区 间 一 一 可 以 建立 在 由 渐 近 理论 推 尝 出 的 毒 近 抽样 分 布 基础 之 土 。 

渐 近 分 布 理论 的 两 大 基石 是 大 数 定律 和 中 心 极限 定理 ,它们 在 2.6 节 都 进行 了 介绍 。 
本 节 首 先 继续 讨论 大 数 定律 和 中 心 极限 定理 ,包括 对 大 数 定律 的 证 明 。 然 后 ,我 们 介绍 另外 
两 个 分 析 工 具 ; Slutsky 定理 和 连续 上 映射 定理 (Slutsky’s theorem and the continuous mapping 
theorem) ,它们 扩展 了 大 数 定律 和 中 心 极 限定 理 的 用 途 。 例 如 ,我们 利用 这 些 工 具 证 明了 基 
于 了 的 检验 假设 E(Y) =u, 的 1 统计 量 在 零 假设 下 服从 标准 正 态 分 布 。 

















15.2.1 依 概率 收敛 和 大 数 定律 


依 概 率 收敛 和 大 数 定律 的 概念 在 2.6 节 中 做 了 介绍 。 在 这 里 ,我 们 给 出 了 依 和 概率 收敛 

的 精确 数学 定义 ,接着 表述 了 大 数 定律 的 内 容 , 并 给 予 了 证 明 。 
-BU ARRERA 。 设 3 ,9 ,…,5.， 为 随机 变量 的 一 个 序列 。 例 如 ,S, 可 能 是 随 
机 变量 了 的 na 个 观测 值 的 样本 均值 了。 如 果 对 于 任意 的 正常 数 8, 当 mn 一 om 时 ,S, E n BJ +8 
之 内 的 概率 趋向 于 1 ,那么 称 这 个 随机 变量 序列 | 8,| 依 概 率 收 伍 (converge in probability) 


于 极限 K( 即 5, 一 一 4) 。 也 就 是 说 ,对 于 任意 的 8>0, 当 nw 时 ， 
S 一 ty, 当 且 仅 当 Pr(1S, -p1 >8)—>0 (15.4) 


如 果 S 一 yp, 那么 S 被 称 作 是 六 的 一 个 一 致 估计 量 {Consistent estimator) 

大 数 定律 。 大 数 定律 是 指 , 在 Y... V. 满足 一 定 条 件 下 ,样本 均值 了 依 概 率 收 人 敏 于 总 
HHE. HEF Yo Y, 的 不 同 条 件 ,概率 理 论 家 设计 出 了 多 种 形式 的 大 数 定律 版 本 。 本 
书 所 使 用 的 大 数 定律 版 本 是 ,了 ,…,Y, 是 到 自 于 一 个 有 限 方 差分 布 的 独立 同 分 布 的 抽样 。 
这 种 形式 的 大 数 定律 (在 重要 概念 2.6 中 也 叙述 了 ) 是 ， 

MR Y oY, 是 独立 同 分 布 的 ,E(Y) =py, 且 var( 卫 ) < ,那么 了 py (15.5) 

大 数 定律 的 思想 可 以 从 图 2 一 6 中 看 出 来 : 随 着 样本 容量 的 增加 ,了 的 抽样 分 布 集中 在 
总 体 均 秆 jy 的 周围 。 抽 样 分 布 的 一 个 特征 是 ,了 的 方差 随 着 样本 容量 的 增加 而 碱 少 ; 另 一 
个 特征 是 , 随 着 的 增加 ,了 落 在 jy 的 +8 之 外 的 概率 逐渐 趋 于 零 。 抽 样 分 布 的 这 两 个 特征 
实际 上 是 联系 在 一 起 的 ,大 数 定律 的 证 明 就 利用 了 这 种 联系 。 

大 数 定律 的 证 明 。 了 的 方差 和 了 落 于 jp 的 +65 之 间 的 概率 二 者 之 间 的 联系 ,由 
Chebychev 不 等 式 所 提供 ,该 不 等 式 的 陈述 和 证 明 在 附录 15.2 中 给 出 ( 见 公式 (15.47))。 
对 于 任意 正常 数 g, 根 据 了 写 出 的 Chebycher 不 等 式 为 : 

Prl F ~pe) 26) = var( Y) 8 (15.6) 
由 于 了,…, 是 独立 同 分 布 的 ,是 方 莽 为 四 ,因此 ,var( 了 ) =o7/n。 因 而 ,对 于 任意 8 >0， 
var( Y)/8 =g2/(n) 一 0。 根 据 表 达 式 (15,6) 可 得 到 ,对 于 任意 的 8>0,Pr{lY -uyl >6) 
一 0 ,这 就 证 明了 太 数 定律 。 

一 些 例 子 。 一 致 性 是 渐 近 分 布 理 论 中 的 一 个 基本 概念 ,因此 我 们 介绍 几 个 总 体 均 值 放 ; 
的 一 致 性 和 不 一 致 性 估计 量 的 例子 。 设 了 ,:=1,…,n 是 独立 同 分 布 的 , 且 具 有 正 的 有 限 方 
Aoi ,考虑 下 面 三 个 jnr BEIER (a)m, =Y lb) = (EZE) Fa 了 ,其 中 0<a< 
1;(e)m. = 了 4+1/n。 这 些 估计 量 是 一 致 的 吗 ? 

第 一 个 估计 量 m, 就 是 第 一 个 观测 值 ,因此 EC(m,) ECY) uy, AT m, EIAN. 4 
Mm, 不 是 一 致 的 :对 于 充分 小 的 ,Pr(im, -url 28) =Pr(IY, -pyl zá) (因为 千 >0) 一 定 
是 正 的 ,所 以 , 当 n 一 %% 时 ,Pr{lm, 一 jrl 兰 6) 并 不 趋向 于 零 。 因 此 ,m, 不 是 一 致 的 。 这 个 不 
一 致 性 并 不 奇怪 ,因为 m 仅仅 使 用 了 一 个 观测 值 的 信息 , 随 着 样本 容量 的 增加 , 它 的 分 布 
不 可 能 集中 在 Ar 的 周围 。 

第 二 个 佑 计量 m, 是 无 偏 的 ,但 不 是 一 致 的 。 它 是 无 贪 的 ,是 因为 ， 


EG) = (YEE, ay] = (HE) Eou =m 





a 


其 中 ， ra = 0a) e s (1-9 =a), 


T, 的 方差 是 ; 
te) y esa =ø 1 -a"}(l -at = p ita (lo) 


var( ms ) = ( pa rl ea) a) rod+e) 

当 a— 时 ,该 方差 有 极限 varm) -a)/(1+a)。 倚 紫 , 该 估计 量 的 方差 不 趋向 于 
零 , 该 分 布 没有 集中 在 jy 的 周围 ,而 旦 尽管 估计 量 是 无 偏 的 ,但 也 不 是 一 致 的 。 我 们 也 许 对 
此 感到 惊 证 ,因为 所 有 的 观测 值 都 进入 了 这 个 估计 量 , 但 是 大 多 数 观 测 值得 到 了 非常 小 的 权 
重 { 第 i 个 观测 值 的 权重 与 a 成 比例 , 随 着 i 变 大 , 它 接近 于 零 ) ,而 由 于 这 个 原因 ,如 把 该 
估计 和 量 看 做 是 一 致 的 , 则 相当 于 取消 掉 了 一 小 部 分 抽样 误差 。 

第 三 个 估计 量 m, 是 有 偏 的 ,但 却 是 一 致 的 。 它 的 偏差 是 l/n i R(m.) =E(Y+1/n) spr 
+ 1/n。 但 是 随 着 样本 容量 的 增加 ,偏差 趋向 于 零 , 且 m, 是 一 致 的 ; Pr(lm. -pyl 26) = 
Pr(l Y +1/n -uyl 38) =Pr[|(Y-u,) +1⁄n|z8], 现 有 I(Y-py) +1⁄nl £ tY -uyl +1⁄n, 
PTAR Y- uy) + 1An1 安 8, 必 有 I 了 -jyi +n, Ae, Prii CY -uy +1⁄n1>68] = 
Pr(1Y -pyl +1/n 28) BE Pr[IY-u,) +1⁄/niz8] =Pr(1Y -uyl zë - ln) <oy/[n( ë - 
1An)?] 一 0 ,其 中 最 后 一 个 不 等 式 根据 Chebychev 不 等 式 { 见 表达 式 (115.6) ,对 于 nm >1⁄8, Rl 
6 代替 8-1xn) 得 出 ,由 此 推断 m, 是 一 歼 的 。 这 个 例子 说 明了 一 个 一 般 性 的 结论 :一 个 估计 
蝇 在 有 限 样 本 下 可 能 是 有 偏 的 ,但 是 ,如 果 这 个 偏差 随 着 样本 容量 变 大 而 消失 , 别 这 个 估计 
量 可 能 仍然 是 一 致 的 ( 见 练习 15. 10) 。 


15.2.2 中心 极 限定 理 与 依 分 布 收敛 

如 果 随 机 变量 的 一 个 序列 的 分 布 , 当 nw 时 ,收敛 于 一 个 极限 , 则 随机 变量 的 这 个 序 
列 被 称 为 依 分 布 收 俩 。 中 心 极限 定理 是 指 ,在 一 般 条 件 下 ,标准 化 的 样本 均值 依 分 布 收敛 于 
一 个 正 态 随机 变量 。 

ERRA. BEE F... F. ,…- 是 与 随机 变量 的 一 个 序列 5 ,S; ,…,S,，: 相 对 应 的 
票 积分 布 函 数 的 序列 。 例 如 ,5, 可 能 是 标准 化 的 样本 均值 (了 - im)vez。 如 果 分 布 函 数 
IFIKAT S 的 分 布 F, 那 么 称 该 随机 变量 的 序列 S. G 4 # É 9& (converge in 
distribution) F S{ 记 为 5, —8) ,也 就 是 说 : 

$$, 当 且 仅 当 lim F(t) = FG) (15.7) 

这 里 ,该 极限 在 所 有 的 点 :( 在 该 点 上 极限 分 布 是 连续 的 ) 都 成 立 ,分 布 被 称 为 5, 的 渐 
近 分 布 [asymptotic distribution ) 。 

对 比 依 概率 收 傅 (一 >) 和 依 分 布 收 钱 ( 一 =) 这 两 个 概念 是 很 有 必要 的 。 如 果 
S, ?yi, 那 么 随 着 的 增加 ,5, 会 以 很 高 的 概率 逼近 于 上。 相反 ,如 果 S, S, RAME 
n 的 增加 ,5, 的 分 布 将 下 近 生 8 的 分 布 。 

中 心 极限 定理 。 现 在 我 们 用 依 分 布 收敛 的 概念 重 述 中 心 极限 定理 。 在 重要 概念 2. 7 
中 ,中 心 极限 定理 被 表述 为 ;如 果 Y, Y, 是 独立 同 分 布 的 , 且 0 < =l <m , 则 (7-ar)ver 
的 渐 近 分 布 是 N(0,1 ) ,因为 TF zeda, (Y-n,)Zoy =y n(Y -pr) /oy 因此 ， 中 心 极限 定 
理 可 以 重 述 为 /4( 了 -jy) 一 +0yZ, 这 里 Z 是 一 个 标准 正 态 随 机 变量 。 这 意味 着 当 n 一 名 
时 ,YR( 了 jy) 的 分 布 收 化 于 NN(0,01) ,习惯 上 把 这 个 极限 简写 为 : 




















JË -pm )} NO, o) (15.8) 
也 就 是 说 ,如 果 y... Y, 是 独立 同 分 布 的 , 且 0 <ar < % Anl F - u) By fi kk — 
个 均值 为 零 .方差 为 ot 的 正 态 分 布 。 
扩展 到 时 间 序 列 数据 。2. 6 节 中 所 陈述 的 大 数 定律 和 中 心 极 限定 理 适 用 于 独立 同 分 布 
的 观测 值 。 正 如 第 12 章 中 所 讨论 的 ,独立 同 分 布 假设 对 时 间 序 列 数据 是 不 适合 的 ,从 而 在 
将 这 两 个 定理 应 用 于 时 间 序 列 数据 之 前 ,还 需要 对 其 进行 扩展 。 这 些 扩 展 在 本 质 上 是 技术 
性 的 ,也 就 是 说 结论 是 相同 的 一 一 各 种 形式 的 大 数 定律 和 中 心 极限 定理 都 适用 于 时 间 序 列 
数据 一 一 但 它们 的 应 用 条 件 是 不 同 的 。 这 在 12.4 节 中 做 了 简要 的 讨论 ,但 是 对 时 间 序 列 变 
量 的 渐 近 分 布 理 论 的 数学 处 理 超 出 了 本 书 的 范围 ,有 兴趣 的 读者 可 以 参阅 Hayashi (2000, $ 
2 章 )， 


15.2.3 Slutsky 定理 和 连续 映射 定理 


Slutsky 定理 {Slutsky theorem) 将 依 分 布 收 雍 和 - 致 性 结合 起 来 了 。 假 设 a, 一 a, 其 
中 a 是 常数 , 且 S, 一 "5, 那么 : 


a, +Š, La +S.a,S, i as $ a*i, $, Za, À S/a (15.9) 
这 三 个 结论 一 起 被 统称 为 Slutsky 定理 。 
连续 映射 定理 (continuous theorem) 研究 一 个 随机 变量 序列 S, 的 一 个 连续 消 数 & 的 
浙 近 性 质 。 该 定理 有 两 部 分 。 第 一 部 分 是 ,如 果 S. 依 概率 收 伍 于 常数 ,那么 8(S.) 依 概率 
RAF g ;第 二 部 分 是 ,如 果 S 依 分 布 收 证 于 8, 那么 g(5,) 依 分 布 收 僵 于 g(3)。 也 就 
是 说 ,如 果 g 是 一 个 连续 函数 ,那么 ; 


(站 如 果 S, va, 那么 g(5,) 一 g(a) 

(这 如 果 S, S, A z(S,)— +g(5) 

作为 (i) 的 一 个 例子 ,如 果 总 一 一 o ,那么 VS =sy 一 may。 作 为 (6) 的 一 个 例子 ,假设 

S, -DZ RE Z 是 一 个 标准 正 态 随机 变量 ,并 设 g(5,) =S), F g 是 连续 的 ,因此 连续 映 

射 定理 成 立 , 从 而 g(S,) 一 8( 2) , 即 Sz, REN, S 的 分 布 收 化 于 一 个 标准 正 
态 随机 变量 的 平方 的 分 布 , 反 过 来 它 又 服从 好 分 布 , 即 S? 一 xX!。 


15.2.4 ”应 用 于 基于 样本 均值 的 :统计 量 


现在 ,我 们 利用 中 心 极限 定理 、 大 数 定律 和 Slutsky 定理 证 明 : 当 Y... Y. 是 独立 同 分 
布 的 , 且 0 <E(Y') <w 时 ,基于 了 的 :统计 量 在 零 假设 下 服从 标准 正 态 分 布 。 

检验 基于 样本 均值 了 的 零 假 设 8(Y,) =jp 的 上 统计 量 , 已 在 公式 (2. 50) 中 给 出 。 它 可 
FH: 





(15.10) 


te iee [S]a] (15.11) 
其 中 ,第 二 个 等 式 用 了 一 个 小 的 戏法 , E E AERA z, 而 得 到 。 

由 于 站,…, 了 ,具有 二 阶 矩 (这 隐 含 在 它们 具有 四 阶 答 的 假设 中 , 见 练 习 15.5) ,并 由 于 
它们 是 独立 同 分 布 的 ,因此 ,公式 (15. 11) 中 最 后 - -个 等 式 的 括 导 中 的 第 一 项 服从 中 心 极限 


定理 :在 零 假设 下 ,WR( 了 -po)/oy -一 w(0,1)。 又 因为 号 -全 so3( 在 附录 3.3 中 已 证 明 ) ， 
MAs 一 1 ,公式 (45.11) 中 第 二 项 的 比率 趋向 于 1( 见 练习 15.4)。 因 此 ,公式 
(15. 11) 中 最 后 一 个 等 式 最 后 的 那个 表达 式 具有 与 表达 式 (15. 9) 中 最 后 一 个 表达 式 相同 的 
形式 ,其 中 (用 公式 (15.9) 中 的 记号 表示 ) S, = va (F -per —N(0,1), H 
a, =s oy <io RIM Slutsky 定理 得 到 :一 (0,1)。 


15.3 OLS 估计 量 和 /统计 量 的 渐 近 分 布 - 


回想 一 下 第 4 章 ,在 重要 概念 4 3 的 假设 下 (重要 概念 15.1 中 的 前 三 个 假设 ) ,0LS f 
HE A, 是 一 致 的 , 旦 va( 房 -B,) 服 从 渐 近 正 态 分 布 。 此 外 ,检验 零 假设 B, =B,。 的 :统计 量 
在 该 零 假设 下 服从 崭 近 标准 正 态 分 布 。 本 节 归 纳 了 这 些 结果 ,并 给 出 了 它们 的 详细 证 明 。 


15.3.1 OLS 估计 量 的 一 致 性 和 渐 近 正 态 性 
最 初 在 重要 概念 4 4 中 陈述 的 房 的 大 样本 分 布 为 : 


varí z, ) 
[var X.) ]° 
其 中 ,v= ( -ux)u,, HR 43 中 有 该 结论 的 简要 证 明 , 但 是 ,省 略 了 一 些 证 明 的 细节 ,并 
且 还 需要 一 个 近似, 那个 证 明 过 程 设 有 给 出 该 近似 的 正式 说 明 。 那 个 诞 明 中 所 省 略 的 步骤 
都 留 作 练习 15.3. 
表达 式 (15. 12) 的 一 个 含义 是 , 记 是 一 致 的 估计 量 ( 见 练习 15.4), 


15.3.2 ” 异 方差 稳健 的 标准 误 的 一 致 性 


在 前 三 个 最 小 二 乘 假设 下 Â, 的 蜡 方差 稳健 的 标准 误 构成 了 有 效 统计 推断 的 基础 , 具 
kik: 





Jal -p) NO, ) (15. 12) 


A 


F, 
— Pa (15.13) 
T 


HEP oh =var(t,)/1n[var(X.)] | ,而 0 是 由 公式 (4.19) 所 定义 的 异 方差 稳健 的 标准 误 
的 平方 , 即 : 





1 - y2” 
— >x (X - X) u 
oh = 1 (15.14) 
LO - Dn] 
为 了 证 明 表达 式 (15. 13) 中 的 结论 , 先 使 用 o 和 的 定义 将 表达 式 (15. 13) 中 的 比率 
重 写 为 ; 








(15. 15) 


P. ， Lax - X)2⁄2 ipa -pp 
Th, = | varv, ) | + | var( X.) 

我 们 需要 证 明 , 公 式 (15. DAAT EE Wb MRETI. TR, B 

TAAT 1, 而 根据 样本 方差 的 一 致 性 ( 见 附 录 3. 3) wa IB IM ERAT rT. Hit, 38 








下 的 工作 是 只 需 证 明 第 二 项 依 概 率 收敛 于 1, 即 iy (X, -DI valt, ) o 
证 明 一 L ya ~ 玉 )? 训 var(z,) 分 两 步 进行 。 首 先 证 明 一 LY narto), 然后 证 


明 LY (X, - X)'u - lf. o, 

现在 ,假定 所 和 REARGECH ECX) < > PECE) <o ) 一 “一 个 比 第 三 个 最 小 
二 乘 假设 所 要 求 的 四 阶 拒 更 强 的 假设 。 要 证 明 第 一 步 ,我 们 必须 证 明 LY 服从 表达 式 
(15.5) 中 的 大 数 定律 。 要 做 到 这 一 点 ,# 必须 是 独立 同 分 布 的 (由 第 二 个 最 小 二 乘 假设 可 
知 ) , 且 Yar( 加 ) 必 须 是 有 限 的 。 要 证 明 var(22) < % ,应 用 Cauchy-Sehwarz 不 等 式 ( 见 附录 
15.2) ivar( 0?) EC) =E[(X, -pr) ut] sIE[ (X, -p EGE) 2. AE AR X, Mu, 
REAME 382 2 有 进而 满足 表达 式 (15.5) 中 的 大 数 定律 。 

第 二 步 是 要 证 明 工 LS- -Fyi LY p0, BA o, = (X, -n u, ,所 以 ,第 二 
步 就 是 要 证 明 ， 

LSL -DE pa] 0 (15.16) 

证 明 这 个 结果 需要 设 定 和 站 =u, - (É, - 8.) - (É, -B1)X, 将 表达 式 (15.16) 插 导 中 的 项 

展开 ,反复 应 用 Cauchy-Schwarz 不 等 式 ,同时 利用 应 M Ê, 的 一 致 性 。 代 数 细节 留 作 练 习 


15.9. 
前 面 的 讨论 假定 大 和 RAS ABU. HX JE Je p Eh, ERREX, 和 R. 


有 四 阶 矩 (就 如 在 第 三 个 最 小 二 莱 假 设 中 所 述 的 ) 下 ,就 可 以 证 明 结论 ， LY (X, =- X) 
5 var(v,) ,但 是 这 个 证 明 超 出 了 本 书 的 范围 , 详 见 Hayashi( 2000,2. 5 节 )。 


15.3.3 ” 异 方差 稳健 的 :统计 量 的 浙 近 正 态 性 


我 们 现在 证 明 , 如 果 最 小 二 恢 假 设 1 ~3 成 立 , 那 么 在 零 假设 下 ,检验 假设 B=Bio 的 蜡 
方差 稳健 的 上 统计 量具 有 渐 近 的 标准 正 态 分 布 。 
利用 异 方差 稳健 的 标准 误 SE) = zi (定义 在 公式 (15. 14) 中 ) 所 构造 的 :统计 量 为 ; 


ñ. -Po AÊ Pio) -Pio) JA 
t= (15.17) 
à, mr oh 


由 表达 式 (15. 12) 可 知 ,等 式 (15. 17) 的 第 二 个 等 式 之 后 括号 中 的 项 依 分 布 收敛 于 标准 正 态 
随机 变 其 。 此 外 , 由 于 蜡 方差 稳健 的 标准 误 是 一 致 的 ( 见 公式 (15.13)), 因 此 


JTA 一 1( 见 练习 15.4)。 利 用 Slusky 定理 可 得 :一 一 W(0,1)。 


-15.4 “误差 为 正 态 分布 时 的 精确 抽样 分 布 


在 小 样本 条 件 下 ,OLS 估计 草 和 + 统计 量 的 分 布依 赖 于 回归 误 善 的 分 布 ,而 且 适 常 是 很 











p 





15.4.2 间 方 差 惟一 的 1 统计 量 的 分 布 
检验 零 假 设 B, =B,.o 的 同方 差 惟一 的 :统计 量 为 : 


,Bi -Bo -Bl ü (15.22) 
SE(B,) 
BErRE,SE(A ) 是 用 记 的 同方 差 惟一 的 标准 误 计算 的 , 将 SE( 启 ) 的 公式 ( 见 附录 4.4 中 的 公 
式 {4. 58)) 代 入 公式 (15. 22) ,重新 整理 得 到 : 
ñ, -Bn - 
+F (Y. - X)° 








o (PPro) /aps (15.23) 


/W/(na- 2) 
Hp, = W= Y 271, ERBRT, Ê RALA X X, HRR NG o 


o O fB AE, AROS. 23) 最 后 一 个 表达 式 中 的 分 子 服从 标准 正 态 分 布 W(0,1)。16.4 
节 中 证 明了 于 服从 自 出 度 为 n -2 的 卡 方 分 布 ,而 且 外 独立 分 布 于 公式 (15. 23) 分 子 中 的 
标准 化 的 OLS 佑 计量。 根据 上 分 布 的 定义 ( 见 附 录 15. 1) ,在 五 个 扩展 的 最 小 二 乘 假设 下 ， 
同方 善 惟一 的 ! 统计 量 服从 自由 度 为 上 -2 的 上 分 布 。 
白 由 度 如 何 调整 才 合适 ? 只 中 的 自由 度 调 整 确保 了 吕 是 er 的 一 个 无 偏 估 计量 ,并 且 妆 
误差 服从 正 态 分 布 时 ,# 统计 量 服 从 学 生 上 分布。 
IT W = Y: um, 是 一 个 服从 自由 度 为 -2 的 卡 方 分 布 的 随机 变量 ,其 均值 为 E( W) 
=n -2,P 因此 ， > 2)] = (n -2)/(n -2) =1。 重 新 整理 下 定义 的 公式 ,我 们 便 有 
三 1, 因而 ， B HEEE ŻE o 的 一 个 无 偏 估计 量 。 同样 ,用 n—2 而 不 


En 去除, 公式 (15. 233) 最 后 一 个 表达 式 的 分 母 中 的 项 与 附录 15.1 中 给 出 的 学生: 分布 随 
极 变 量 的 定名 相 匹配 。 也 就 是 说 ,通过 使 用 自由 上 度 调整 来 计算 标准 误 , 当 误差 服从 正 态 分 布 
时 ,t 统 计量 服 从 学 生 上 分布 。 











5.5 ”含有 同方 差 误差 的 OL 估计 量 的 有 效 性 - 


为 什么 我 们 使 用 OLS 估计 Bo fa 8, 呢 ? 在 第 4 章 中 ,我 们 说 使 用 OLS 估计 量 的 一 个 原 
因 是 ,大 多 数 人 基本 上 都 是 利用 OLS 进行 估计 的 ,这 样 我 们 就 和 其 他 的 实证 研究 人 员 “ 有 共 
局 语言 "+ 了。 尽管 如 此 ,这 种 说 法 在 理论 层次 上 仍 是 没有 说 服 力 的。 从 理论 上 讲 , 选 择 一 种 
估计 量 而 不 是 另 一 种 估计 景 应 该 以 一 般 性 原理 或 应 用 某 个 一 致 的 标准 为 指导 。 如 3. 1 节 中 
所 讨论 的 ,通常 有 两 个 标准 可 用 来 选择 估计 量 :一 个 是 估计 量 应 该 是 无 偏 的 ; 另 一 个 是 它 应 
该 具有 尽 可 能 小 的 方差 ， 

本 节 我 们 将 证 明 ,根据 这 两 个 标准 ,OLS 估计 其 在 一 定 条 件 下 可 能 是 最 佳 佑 计量。 具体 
地 讲 , 高 斯 一 马尔 可 夫 定 理 指出 , 当 回 归 误 差 是 同方 差 的 时 , 以 ,… X, 为 条 件 的 OLS fi 
计生 在 所 有 的 以 了, ,…,Y 为 线性 条 件 和 所 有 的 条 件 无 偏 的 ( A X ，… X, 为 条 件 无 偏 的 ) 售 
计量 中 ,具有 最 小 的 方 莽 。 换 句 话 说 ,OFLS 估计 量 是 和 最 佳 线 性 条 件 无 偏 估 计量 { best Inear 





p 


conditionaliy unbiased estimator, 即 BLUE)。 这 一 结论 为 使 用 OLS 估计 其 提 殿 了 一 个 重要 
的 理论 根据 。 

我 们 从 陈述 高 斯 一 马尔 可 夫 条 件 开始 ,这 些 条 件 是 高 斯 一 马尔 可 夫 定 理 成 立 的 条 件 。 
然后 ,我 们 定义 线性 无 偏 估 计量 的 类 别 ,证明 OLS 估计 量 属于 此 类 ,而 后 转 到 高 斯 一 马尔 可 
夫 定 理 本 身上 。 


15.5.1 高 斯 一 马尔 可 夫 条 件 


有 三 个 高 斯 一 马尔 可 夫 条 件 。 第 一 个 条 件 ,给 定 所 有 回归 因子 ,…,X, 的 观测 值 ,& 
具有 条 件 零 均值 ;第 二 个 条 件 ,u, 是 同方 差 的 ;第 三 个 条 件 , 以 X,，…,X, 为 条 件 的 误差 项 在 
不 同 的 观测 值 之 间 不 相关 。 即 三 个 高 斯 一 马尔 可 去 条 件 1Gauss-Markov conditions) 是 ， 

(i)E(u X, X.) =0 
(ii)var(u X... K =0 0 <o ea i], n (15.24) 
Cii E( ues lX... X.) =0,i=1,.nJg=l,e n, 

重要 概念 15. 1 中 的 前 四 个 最 小 二 莱 假 设 就 已 隐 合 了 遍 斯 一 马尔 可 夫 条 件 。 因 为 观测 
值 是 独立 同 分 布 的 (假设 2) ,E(w ，… X E(u 1X,) ,而 且 根 据 假设 1, 便 有 Elu! X.) 
=0, 所 以 条 件 ( 认 成 立 。 同 样 ,根据 假设 2 var(u lX... X ) = varle, lX), V EB 4 
(同方 差 性 ) var(u l X) =o CETER. B 3( 非 零 的 有 限 的 四 阶 矩 ) 确 保 了 0 < 
<= ,因此 条 件 ( 起 成 立 。 为 了 证 明 条 件 { 证 ) 隐 含 在 前 四 个 最 小 二 乘 假设 中 ,要 注意 
(1 ,因为 根据 假设 2,(X, ,了 ) 是 独立 同 分 布 的 。 假设 2 还 
ASEF ij, E uu X, X) E(u IX E(u tX) RRJ 15.7) ,因为 对 于 所 有 的 
i E(u, 1X,) =0, AA AFEA ij A E(uu, XX) =0, AMA tF G) pk y. A 
此 ,重要 概念 15.1 中 的 最 小 二 乘 假设 1 -4 和 隐 含 了 公式 (15. 24) 中 的 高 斯 一 马尔 可 夫 条 件 。 


15.5.2 ”线性 条 件 无 偏 估计 量 ( linear conditionally unbiased estimators ) 


线性 条 件 无 偏 佑 计量 ,是 由 及 WRAL X, A AR N, Y. 为 线性 函数 关 
系 的 无 篇 估计 量 所 组 成 。0LS 人 竺 计 量 就 是 一 个 线性 条 忻 无 篇 居 计量 。 
线性 条 件 无 偏 估计 此 的 类 别 。 与 于，… ,了 为 线性 关系 的 估计 量 是 了 ,… Y. 的 加 权 平 
均 。 也 就 是 说 ,如 果 房 是 个 线性 估计 量 ,那么 它 可 被 写 为 ; 
ñ, = Yay, (Ë, 是 线性 的 } (15.25) 


其 中 ,al ,… ,a 是 权 数 ,这 些 权 数 可 能 依赖 于 X... X. E BTK FEILAR B FZ 
AF Yis Yno 

MRSE X... X. ñ 的 条 件 抽样 分 布 的 均值 是 8, MAEA, 是 条 件 无 偏 的 。 也 
就 是 说 ,如 果 公式 (15. 26) 成 立 ,那么 记 是 条 件 无 偏 的 。 

EC X... X.) =p ( 房 是 条 件 无 偏 的 ) (15.26) 

如 果 估 计量 房 可 写成 公式 (15.25) 的 形式 ( 它 是 线性 的 ) ,而 且 公 式 (15. 26) 成 立 ,那么 
AHAS 是 个 线性 条 件 无 偏 佑 计量。 

OLS 估计 其 启 TRTE Eti EB Â 是 线性 的 ,首先 要 注意 到 , 因为 


FX- =0 (根据 的 定义 )， $a -DY - P) = $ -DY -7X (x, - X) 











FATET] 








- y (X. - FY, R SS BQ A Z538(15.2) th ñ, 的 公式 ,得 到 : 


DY 
B = 


= ,其 中 ,a = -ŽA (15. 27} 


I YO, -于 ü >, (x, - 3° 
< £ 


由 于 公式 (15. 27) 中 的 权重 上 ,= 1, n WF X... KX. ERREF Y... Y, bt, 
OLS 估计 量 是 个 线性 佑 计量 。 

在 高 斯 一 马尔 可 夫 条 件 下 A ERER, HERE X... X. 条 件 下 ñ, 的 条 件 分 
布 的 方 其 是 ; 


2 
Gy 


var(B | XXn) = chi, = — (15.28) 


> (X, - X) 
Ê 是 条 件 无 偏 的 结论 已 在 公式 (15. 20) 中 证 明了 ,公式 (15, 28) 中 的 方差 公式 在 前 面 作为 公 
式 (15. 18) 被 推导 出 来 。 公 式 (15. 18) 和 和 公式 (15. 20) 是 在 重要 概念 15.1 中 的 所 有 五 个 最 
小 二 飞 假 没 ( 包括 正 态 分 布 误差 假设 ) 下 推导 的 。 但 是 ,从 推导 过 程 来 看 ,你 可 以 证 明 , 在 等 
式 (15. 18) 和 公式 (15.20) 中 的 这 些 结论 , 可 以 在 较 弱 的 高 斯 一 马尔 可 夫 条 件 下 成 立 , 尤 其 
是 不 要 求 误差 项 最 从 正 态 分 布 。 


15.5.3 高 斯 一 马尔 可 夫 定 理 

高 斯 一 马尔 可 夫 定 理 { Gauss-Markov theorem} 措 出 ,在 公式 (15.24) 中 的 高 斯 一 马尔 
TARIEF AE X ,… ,XX,,0LS AH G ñ, Ae 的 所 有 线性 条 件 无 偏 估 计量 中 具有 最小 的 
方 莽 ,也 就 是 说 ,01S 估计 量 是 BLUE. 高 斯 一 马尔 可 夫 定 理 在 重要 概念 15.2 中 进行 了 陈 
述 ,并 在 附录 15.3 中 进行 了 证 明 ， 
重要 概念 15. 2 

对 于 应 的 帘 斯 一 马尔 可 失 定 理 

假设 公式 (15. 24) 中 的 沿 斯 一 马尔 可 夫 条 件 成 立 ,那么 OLS 估计 量 启 就 是 最 佳 线 性 无 
偏 估计 量 (BLUE) .也 就 是 说 ,对 所 有 的 线性 条 件 无 偏 佑 计量 局 面 言 ,var( 名 1X X.) < 
var( ñ, lX. OP 

样本 岁 值 是 E( 了 ) 的 线性 有 效 估计 量 。 高 斯 一 马尔 可 夫 定理 的 一 个 应 用 是 ,当世 .---, 
Y. 独立 同 分 布 时 ,样本 均值 了 是 E( Y) 的 最 有 效 的 线性 估计 量 。 为 了 弄 清 楚 这 一 点 ,考虑 
一 个 没有 "2 的 回归 的 情况 ,因此 ,惟一 的 回归 因子 是 常数 回归 因子 X, = 1 ,那么 OLS 估计 
RÂ =Y, 由 此 得 出 ,在 高 斯 一 马尔 可 夫 假 设 下 ,了 是 BLUE。 注 意 ,高 斯 一 马尔 可 夫 的 一 个 
要 求 条 件 即 误差 是 同方 差 的 ,在 这 里 是 不 重要 的 ,因为 这 里 没有 回归 关子 。 关 此 ,如 果 Y, 
-Y 是 独立 同 分 布 的 ,那么 就 可 以 得 出 了 是 BLUE 。 这 个 结果 已 在 重要 概念 3.3 中 和 叙述 
过 了 。 

当 丰 二 随机 时 的 高 斯 一 马尔 可 夫 定 球 。 当 政 非 随机 时 ,高 斯 一 马尔 可 去 定理 在 解释 上 
有 一 点 点 变化 , 即 高 斯 -一 马尔 可 夫 定 理 同 祥 适用 于 非 随 机 回归 因子 的 情形 ,也 即 适用 于 在 重 
复 抽 祥 中 其 值 保持 不 变 的 那些 回归 因子 。 具 体 来 说 ,如 果 第 二 个 最 小 二 乘 假 设 被 太 ,…, 妃 











估计 量 。 在 实践 中 要 实际 运用 WLS ,必须 估计 函数 ,下 面 我 们 就 来 讨论 这 个 问题 。 
15.6.2 含有 已 知 函数 形式 异 方差 的 WLS 


如 果 异 方差 具有 已 知 的 函数 形式 ,那么 异 方差 函数 就 可 以 估计 ,而 且 用 这 个 估计 函数 
就 可 计算 WLS 全 计量 。 

Pl 的 方 基 是 的 二 次 卫 数 。 假 设 条 件 方差 是 已 知 的 ,而 且 是 二 次 函数 。 

Yar( |X,) = 0, + 0, X° (15.32) 

其 中 , 和 ERISH, >0 HB. 0, =0. 

由 于 名 和 如 是 木 知 的 ,因此 构造 加权 变量 上, 叉 , 和 总, 是 不 可 能 的 。 不 过 ,可 以 估计 久 
和 6 ,并 利用 这 些 估计 值 计算 var(u XO EPF, BEA, HUD, 3⁄2 0, MO, 的 估计 量 , 并 设 
var(u lX.) = 六 + 页 下 。 定 义 加 权 回 归 因 子 芝 = 了 A/ 王 人世) X, =14Aala X), X, 


=X,A/vat(u, | X.) WLS 估计 量 就 是 艺 对 总 和 各 ,回归 中 系数 的 9LS 估计 量 (其 中 ,B, 名 代 
# TRIES) 

应 用 这 一 估计 基 要 求 估计 条 件 方差 函数 ,也 就 是 说 ,估计 公式 (15. 32) 中 的 名 Mos — 
致 地 估计 如 和 的 一 种 方法 是 用 六 wJ XI 进行 OLS 回归 ,其 中 ,让 是 第 i 个 OLS RAR 
平方 。 

假设 条 件 方 差 具 有 公式 (15. 32) 的 形式 , 且 Â, A Â, Eea Mo aita, ag 
概念 15. 1 的 1~3 个 假设 下 ,再 加 上 由 于 需要 估计 0, 和 名 MERGEA, WL 估计 量 的 
汤 近 分 布 同色 和 上 已 知 时 的 相同 。 因 此 ,含有 已 估计 的 外 sü 0, 8) WL 估计 量 与 那个 不 
可 行 的 WLS 具有 相同 的 渐 近 分 布 ,从 这 个 意义 上 说 , 它 是 淅 近 的 BLUE, 

因为 WLS 的 这 种 方法 能 够 通过 估计 条 件 方差 函数 的 未 知 参数 来 执行 ,所 以 ,这 种 方法 
有 时 又 被 称 为 可 行 的 WLS 1 feasible WLS) 或 估计 的 WLS {estimated WLS), 

例 2: 方 差 依赖 平 第 二 变量 。 当 条 件 方差 依赖 于 一 个 不 出 现在 回归 函数 中 的 第 三 变量 
W. 时 ,也 可 以 使 用 WLS。 具 体 来 说 ,假设 搜集 了 三 个 变量 了 ,于 ,和 形 ,i =1,…,n 的 数据 ;总 体 
回归 函数 依 束 于 X, 但 不 依赖 于 现 ;条 件 方差 依赖 于 更 ,但 不 依赖 于 在 。 也 就 是 说 , 闪 体 回 
ARRE EYI, W) =B, +B,X,, IEE 22 E var(u 1X, W) =Ah(W) ,其 中 入 是 常数 ， 
h 是 待 估计 的 函数 。 

例如 ,假设 一 位 研究 人 员 对 建立 某 一 个 州 的 失业 率 和 该 州 的 经 济 政策 变量 (X,) 之 间 的 
关系 模型 感 兴趣 ,但 是 ,所 测量 的 失业 率 (7.) 是 基于 一 个 抽样 调查 的 失业 率 , 它 是 真实 失业 
F(Y ) 的 估计 值 。 因 此 ,用 予 WEY 是 有 误差 的 ,这 里 的 误差 来 源 于 常规 的 随机 抽样 误 
差 ,从 而 了 =Y* +v,, 其 中 ,z, 是 由 调查 引起 的 测量 误差 。 在 这 个 例子 中 ,调查 样本 容量 W. 
本 身 并 不 是 真实 失业 率 的 一 个 决定 性 因素 ,看 土 去 这 似乎 是 合理 的 。 因 此 ,总 体 回归 函数 不 
依赖 于 W. BI ECY? IX W,) =B +B1X,。 所 以 ,我 们 有 下 面 队 个 方程 ; 

Y" =B +B,X, tu (15. 33) 

Y. =Y” +r, (15.34) 

其 中 ,公式 (15. 33) 建 立 了 州 经 济 政策 变量 和 真实 的 州 失 业 率 之 间 的 关系 的 模型 , 面 公式 
(15. 34) 表示 了 所 测度 的 失业 率 了 与 真实 失业 率 y: 之 间 的 关系 。 

在 公式 (15. 33) 和 公式 (15. 34) 中 的 模型 可 以 导出 一 个 误差 的 条 件 方 差 依赖 于 W, 但 不 
依赖 于 元 的 总 体 回归 。 公 式 (15. 33) 中 的 误差 项 u ”代表 了 被 这 个 回归 忽略 了 的 其 他 因 


K. 而 公式 {15. 341 中 的 误 善 项 o 代表 了 由 失业 率 调查 所 引起 的 测量 误差 。 如 果 wu” 是 同方 
差 的 ,那么 var( a lX W) =r 是 常数 。 可 是 ,调查 误差 方差 反 向 依赖 于 调查 样本 容量 
W, Ep var(s 1X, W) =a W, Pa 是 一 个 常数 。 由 于 六 是 随机 调查 误差 ,我 们 可 以 放心 
地 假定 它 与 a" 无 闫 ,因此 ,var(w* +ç X. W.) = +a/ 取 。 所 以 ,将 公式 (15.33) 代 入 公 
式 (15. 34) 得 到 一 个 含有 异 方 差 的 回归 模型 : 
Y, =B +B X, +u, (15.35) 
var(u 1X, , W,) =0, +0 (17W,) (15.36) 
其 中 ,=a +e h =t., b =a,E(u IX W.) =0, 

WR 0, 和 如 是 已 知 的 ,那么 可 以 使 用 公 这 (15. 36) 中 的 条 件 方差 函数 通过 WLS 估计 
Bs AB. EEFT. o Ao 是 未 知 的 ,但 是 它们 可 以 通过 用 0LS 残 差 的 平方 (来 自 公 式 
(15. 35) 的 OLS 桔 计 ) 对 1/ 于 进行 回 好 来 估计 。 于 是 ,所 估计 的 条 件 方差 函数 能 用 于 构造 
可 行 的 WLS 中 的 权 数 。 

应 该 强调 的 是 ,E(u IX. W.) =0 这 个 条 件 是 非常 关键 的 ;否则 ,加 权 误 差 将 含有 非 零 的 
RIFET, WLS 也 将 是 不 一 致 的 。 换 句 话 说, 如果 W. 实际 上 是 工 的 一 个 决定 性 因素 , 那 
么 公式 (15, 35) 就 应 该 是 一 个 同时 包含 和 W. 的 多 元 回归 方程 。 如果 F, 和 XX, 是 不 相关 
的 ,多 是 了 的 一 个 决定 性 因素 ,而 且 如 果 W. 没有 包括 在 这 个 回归 模型 中 ,那么 OLS E Xia 
的 ,但 WLS 是 不 一 致 的 。 

可 行 的 WLS 的 一般 方 法 。 可 行 的 WLS 一 般 按 照 以 下 四 个 步骤 进行 ， 

1. FEY, Xt X, 进行 OLS 回归 ,获得 OLS 3822 miel, nno 

2. 估计 一 个 条 件 方 差 荡 数 var(u, 1 乱 ) 的 模型 。 例 如 ,如 果 条 件 方差 函数 具有 方程 
(15. 32) 中 的 形式 ,就 需要 用 u, xf X: 回 归 。 一 般 地 说 ,这 一 步 需 要 估计 一 个 条 件 方差 
var(u, 1X) HRR 

3. 利用 所 估计 的 函数 计算 条 侍 方 差 函 数 的 预测 值 rarf( u, lX.) o 

4. 利用 所 估计 的 条 件 方 差 函 数 平 方 根 的 倒数 对 因 变 量 和 回归 因子 (包括 截 距 ) 加 松 。 

5. 利用 OLS 估计 加 校 回 妇 的 系数 ,相应 所 得 的 估计 量 就 是 WLS 估计 量 。 

回归 软件 包 -- 般 都 包括 加 权 最 小 二 乘 回 妇 的 命令 选项 ,选择 该 选项 则 可 以 自动 完成 上 
面 的 第 四 步 和 第 五 步 。 


15.6.3 蜡 方 差 稳健 的 标准 误 还 是 WLS 

处 理 异 方差 有 两 种 方法 :用 WLS 估计 B, 和 BB, ,或 用 OLS 和 工 方 莽 稳 健 的 标准 误 估计 
B 和 局 。 在 实践 中 确定 选择 何 种 方法 需要 权衡 每 种 方法 的 优 缺 点。 

WLS 的 优点 是 ,WIS 比 初始 回归 因 于 系数 的 OL 估计 量 更 有 效 , 至 少 是 浙 近 有 效 的 。 
WIS 的 缺点 是 , 它 要 求知 道 条 件 方差 函数 ,并 且 要 估计 其 参数 。 如 果 条 件 方差 前 数 具有 方 
程 (15. 32) 中 的 二 次 函数 形式 ,那么 这 是 很 容易 做 到 的 。 然 而 在 实际 中 ,条 件 方差 函数 的 函 
数 形式 很 少 是 已 知 的 。 惕 严重 的 是 ,如 果 函 数 形式 不 正确 ,那么 根据 WS 回 妇 方法 计算 的 
标准 误 是 无 效 的 ,因为 它们 导致 不 正确 的 统计 推断 (检验 中 有 错误 的 规模 ) 。 

使 用 异 方差 稳健 的 标准 误 的 优点 是 ,即使 不 知道 条 件 方差 铺 数 的 形式 ,也 可 以 得 到 渐 近 
有 效 的 统计 推断 。 另 外 一 个 优点 是 ,在 现代 回归 软件 包 中 ,都 把 计算 异 方差 稳健 的 标准 误 作 
为 一 个 可 选 功能 ,所 以 很 容易 计算 ,我 们 无 需 花 费 额外 的 精力 考虑 异 方差 的 威胁。 异 方差 稳 
健 的 标准 误 的 缺点 是 ,OLS 估计 量 的 方差 比 WLS 估计 量 的 方差 (以 真实 条 件 方差 函数 为 基 








础 ) 大 ,至 少 在 渐 近 意义 下 如 此 。 

在 实际 中 ,var( 忆 1( 蕊 ) 的 函数 形式 几乎 是 不 知道 的 ,这 就 为 在 实际 应 用 中 使 用 WLS 带 来 
了 问题 。 在 一 元 回归 中 ,这 个 问题 是 很 难 解决 的 。 在 多 元 回归 模型 中 ,要 确定 条 件 方差 的 转 
数 形式 更 加 困难 。 由 此 ,实际 使 用 WLS 面临 着 许多 的 挑战 相反, 在 现代 统计 软件 包 中 ,使 
用 蜡 方差 稳健 的 标准 误 是 很 简单 的 ,即使 在 很 一 般 的 假设 下 ,所 得 的 统计 推断 也 是 可 靠 的 ， 
尤其 是 , 异 方差 稳健 的 标准 误 在 不 需要 设 定 条 件 方差 的 函数 形式 的 情况 下 就 能 够 使 用 。 综 
上 所 述 ,我 们 认为 ,尽管 WLS 具有 理论 上 的 优越 性 ,但 是 在 大 多 数 的 实际 应 用 中 , 异 方 差 稳 
健 的 标准 误 为 处 理 潜在 的 异 方差 提供 了 一 种 更 好 的 方法 。 


总结: 

1. OLS 佑 计量 的 渐 近 正太 性 与 异 方差 稳健 的 标准 误 的 一 致 性 相 结 合意 味 着 ,如 果 重 要 
概念 15. 1 中 的 前 三 个 最 小 二 乘 假设 成 立 ,那么 异 方差 稳健 的 上 统计 基 在 零 假 设 下 服从 渐 近 
的 标准 正 态 分 布 。 

2 如 果 以 回归 因子 为 条 件 的 回归 误差 是 独立 同 分 布 的 且 服 从 正 态 分 布 ,那么 记 服从 
以 回归 因子 为 条 件 的 精确 的 正 态 抽样 分 布 ， 此 外 ,在 零 假设 下 ,同方 差 惟 一 的 # 统计 其 具有 
精确 的 学 生 4, .抽样 分 布 。 

3. 除了 重要 概念 15. 1 的 前 三 个 假设 外 ,如 果 回 归 误 差 是 局 方差 的 ,那么 在 B 所 有 的 线 
性 条 件 无 俩 估计 量 中 ,OLS 估计 量 房 是 有 效 的 (具有 最 小 方差 ) ,也 就 是 说 ,OLS 估计 量 是 最 
ERER ERIH OLS Æ BLUE), 

4. 加 权 最 小 二 乘 (WLS) 估 计量 就 是 应 用 于 加 权 回 归 中 的 0LS ,这 里 ,所 有 的 变量 都 以 
条 件 方差 rar(u,1X,) 或 其 千 计 值 的 平方 根 的 倒数 为 权重 进行 加 权 。 尽 管 WS 估计 量 在 渐 
近 意义 上 比 0LS 佑 计量 更 有 效 ,但 是 ,要 执行 WLS 你 必须 知道 条 件 方差 函数 的 函数 形式 ， 
而 这 通常 是 个 苛刻 的 要 求 。 


重要 术语 ` 


kkka BAE kotia AEA Slutsky 定理 ”连续 映射 定理 
BLUE ”高 斯 一 马尔 可 夫 条 件 “高 斯 一 马尔 可 夫 定 理 ”加 权 最 小 二 乘法 (WLS) WIS 估计 
E 不 可 行 的 WLS 可 行 的 WLS 正 态 概 率 密 度 函数 ”二 元 正 态 概 率 密度 函数 











复习 概念 - 

15.1 假设 重要 概念 15.1 中 的 假设 4 成 立 , 但 是 你 在 大 样本 条 件 下 使 用 异 方差 稳健 的 
标准 误 构造 了 Bi 的 95 狗 的 置信 区 间 。 这 个 置信 区 间 会 是 渐 近 有 效 的 吗 ? 也 就 是 说 ,对 于 
很 大 的 nn, 它 在 95% 的 所 有 重复 抽样 中 包含 8, 的 真实 值 吗 ? 反 过 来 ,假设 重要 概念 15. 1 中 
的 假设 4 不 成 立 ,但 是 你 在 大 样本 条 件 下 用 同方 差 惟一 的 标准 误 公式 构造 了 的 5% 的 置 
信 区 间 。 这 个 置信 区 间 是 浙 近 有 效 的 吗 ? 

15.2 假设 4, 是 一 个 依 概率 收敛 于 3 的 随机 变量 ,8, 是 一 个 依 分 布 收敛 于 标准 正 态 
分 布 的 随机 变量 。4,8, 的 浙 近 分 布 是 什么 ? 使 用 这 个 渐 近 分 布 计算 Pr(4,B,) <2 的 近 





WE. 

15.3 假设 了 和 天 以 下 列 回归 的 方式 联系 在 一 起 :Y=1.0+208+zae 一 位 研究 人 员 
HA Y fn X HRA, rH 0<X=20, xFF0=#=X=10,34F2 235 var(u X, =x) = 工 而 对 于 
10 <X=20,var(u lX =x) =16。 画 出 观测 值 ( 世 ,站 ) ,i =1,…,n 的 假设 的 散 点 图 。WIS 会 
给 X10 或 给 工 > 10 赋 子 较 高 的 权重 吗 ? 为 什么 ? 

15.4 在 十 面 的 问题 中 ,该 研究 人 员 决 定 不 用 WIS, MERANIE 的 观测 值 计算 
OLS 估计 量 , 然 后 再 用 六 > 10 的 观测 值 计算 OLS 合计 芷 ,最 后 取 估 计 量 的 两 个 OLS 的 平均 。 
这 种 做 法 比 WLS 好 吗 ? 


-练习 - 


15. 1 考虑 不 含 截 距 项 的 回归 模型 了 =p X, +u (IN RES, 的 真实 值 为 零 ) 。 

a 对 这 个 有 约 东 的 回归 模型 了 = 8 X, + 四 ,推导 局 的 最 小 二 乘 佰 计量 。 这 个 估计 进补 
称 为 8, 的 有 约束 的 最 小 二 乘 人 计量 (68“) ,因为 它 是 在 一 个 约束 条 件 下 合计 的 (这 里 
Bo =ü) a 

b， 在 重要 概念 15. 1 的 假设 1~3 下 E A AEA. 

c ERAU 是 线性 的 ( 见 公 式 (15.25) ) ,并 且 在 重要 概念 15.1 的 假设 1 ~2 下 , 它 是 
条 件 无 偏 的 ( 见 公式 (15. 26) ) 。 

d. 在 高 斯 一 马尔 可 夫 条 件 下 ,推导 房 “ 的 条 件 方差。 

e 在 高 斯 一 马尔 可 夫 条 件 下 ,比较 (d) 中 ñr 的 条 件 方差 和 OLS 估计 量 房 ( 从 包含 截 
距 的 回归 中 得 到 的 ) 的 条 件 方差 。 哪 一 个 佑 计量 是 更 有 效 的 ? 使 用 这 里 的 条 件 方差 的 公式 
来 解释 。 

t 在 重要 概念 15.1 的 假设 1~5 T, 推导 局 ”的 精确 抽样 分 布 。 


g 现在 考虑 估计 量 房 = Xy $ X, EMME 马尔 可 夫 条 件 下 ,推导 var( 房 4， 
站) var (1X,…, 大 的 表达 式 ,并 使 用 这 个 表达 式 证 明 var (Å X, .. X.) > 
varl Br X... Xn) o 

*15.2 BRG ,了 ) 是 独立 同 分 布 的 , 旦 具有 有 限 四 阶 矩 。 证 明 : 样 本 协 方差 是 总 体 


协 方差 的 一 个 一 致 估计 量 , 即 sw 一 ow, 其 中 ,swy 按 公式 (3. 22) 中 的 定义 。( 提示 :使 用 附 
录 3.3 中 的 方法 和 Cauchy-Schwarz 不 等 式 ) 

15.3 ”本题 补充 了 附录 .3 中 给 出 的 启 渐 近 分 布 推导 的 详细 过 程 。 

a 使 用 公式 (15. 19) 推 导 下 式 。 


fl < = fl < 
Yn (18.37) 


ipa- tọ- 
AAD yh 2) 





MAB, - A) = 


其 中 ,v= (X, -Bx)u,s 

b. 使 用 中 心 极限 定理 、 大 数 定律 和 Slutsky 定理 证 明 , 公 式 (15. 37) 中 最 后 一 项 依 概率 
WAF O, 

e. 使 用 Cauchy-Schwarz 不 等 式 和 重要 概念 15.1 中 的 第 三 个 最 小 二 乘 俱 设 证 明 ， 





不 过 由 于 了 是 连续 的 , 它 的 概率 和 期 望 值 的 数学 表达 式 涉及 积分 ,而 不 是 适用 于 离散 随机 
变量 的 求 和 。 

ËL f, 表示 的 概率 密度 函数 。 因 为 概率 不 能 是 负数 ,所 以 对 于 所 有 的 y A f,(y)>0;, 
YAT 和 #&( 这 里 a <45) 之 间 的 概率 为 ; 


peasy<d) = | foa (15.38) 





因为 了 必定 取 实 数 灿 上 的 某 个 什 , 所 以 Pr( - m <Y< wm) =1 ,这 意味 着 | Aod. 
与 离散 随机 变量 一 样 ,连续 随机 变 基 的 期 望 值 和 从 是 它们 值 的 概率 加 权 平 均值 ,只 是 求 
和 (例如 ,公式 (2.4) 中 的 求 和 ) 被 积分 所 取代 。 因 此 ,了 的 期 望 值 为 : 
EUY) =m = [roa (15.39) 
其 中 ,积分 的 范围 是 使 /; 取 非 零 值 的 了 的 所 有 值 的 集合 ,方差 是 (了 -pp,)* 的 期 望 值 ,随机 
JEE r 阶 移 是 了 的 期 望 值 , 因 此 ; 
var( Y) = 于 (了 -Ar 六 = [an (15.40) 








E(Y') = [soy (15.41) 


正 态 分 布 


单 补 居 正 态 分 布 。 一 个 正 态 分 布 晴 机变 量 的 概率 密度 函数 { 正 态 p d. f. {normal 
p.d. f. ) Æ: 





fO) = "| +)] (15.42) 


其 中 ,exp(%) 是 x 的 指数 函数 。 公 式 (15. 42) 中 的 因子 1/(cyrV2z) 确 保 了 Pr( -0 所 了 < 


x) = POCE: 
当 几 =0,oy =1 时 , 正 态 分 布 被 称 为 标准 正 态 分 布 。 标 准 正六 的 p. d. £. 记 为 中 ,标准 
ESK edi 记 为 由 六 此 ,标准 正 态 密度 为 oly) = exp( -7/2)/Y27, 有 (7) = 


OLS 
OP L L 态 分 布 。 两 个 跑 机 变量 天 和 了 的 二 元 正 态 六 df (bivariate normal 
p. 中 ) 为: 


_ l 
sts Zm ] -Pu 
1 x- uY xop f YTE), 了 一 Er 
xed zall Ty ) ?os Ty )( Ty ) ( Ty ) ] (15.43) 
4 X 5 Y RRE lon =0) 时 ,gry(x,7) = 有 r(x) 所 (7) ,其 中 ,f 为 公式 (15. 42) 中 绽 出 的 
正 态 密度 。 这 证 明了 如 果 包 和 了 服从 联合 正 态 分 布 , 且 是 不 相关 的 ,那么 它们 是 独立 分 布 
的 。 这 是 正 态 分 布 的 特殊 性 质 ,其 他 的 分 布 通常 不 具有 这 个 性 质 。 
多 元 正 态 分 布 是 对 双 变量 正 态 分 布 的 扩展 ,以便 处 理 两 个 以 上 的 随机 变量 。 这 种 分 布 
利用 和 托 阵 表述 最 方便 ,附录 16. 1 中 将 给 出 其 表述 。 








人 th 上 





条 件 于 念 分 布 。 设 半 和 工 服从 联合 正 态 分 布 ,那么 给 定 羡 下 了 工 的 条 件 分 布 是 正 态 的 ， 
HIEN Hnr = jh, + (TaT) (X-u ) ,方差 为 Tix =(1 -piy) Tho 在 条 件 X=x 下 ,这 个 条 
件 分 布 的 均值 是 x 的 线性 函数 ,但 方差 不 依赖 于 x, 


有 关 的 分 布 
FA. WZ... Z, 是 个 独立 同 分 布 的 标准 正 态 随 机 变量 ,那么 随机 变 二 
W = yz (15.44) 


服从 自由 度 为 = 的 卡 方 分 布 。 这 个 分 布 记 为 巡 。 因 为 E(22) =1, 所 以 (WW) =n. 
学 | 1 分 布 。 设 2 服从 标准 正 态 分 布 , 罗 服从 好 分 布 , 且 Z 和 WW 是 独立 分 布 的 ,那么 
随机 变革 


z 
= 15.45 
t = ( ) 


服从 自由 度 为 mm 的 学 生 上 分布, 记 为 如。 扩 分 布 就 是 标准 正 态 分 布 。 
F yt É W.W, 分 别 是 自由 度 为 m,n 的 卡 方 分 布 的 独立 随机 变量 ,那么 随机 变量 
服从 自由 度 为 (n,n,) 的 下 分 布 。 这 个 分 布 记 为 F. o 
F tili qay F H HE n 和 分 母 自 由 度 wn,。 随 着 分 母 自由 度 的 变 大 , 琴 , ,分 布 很 好 
地 被 用 mm 除 的 刀 分 布 近似 。 在 极限 状态 下 ,已 ， -分 布 与 用 mm 除 的 好 分布 相同 , 即 它 与 
好 Am 分 布 相同 。 





(15.46) 


[附录 15.2 两 个 不 等 式 ] 
本 附录 投 述 并 证 明了 Chebycher 不 等 式 和 Cauchy-Schwarz 不 等 式 。 


Chebychey 不 等 式 
Chebychev 不 等 式 使 用 随机 变量 了 的 方差 确定 中 超出 其 均值 +8 范围 的 概率 ,其 中 8 是 
Pr{ |V -uyl ë) = var( F) E ( Chebychev 不 等 式 ) (15.47) 





要 证 明 不 等 式 (15. 47) DE = V - z, f EWK p. d f ,8 为 任意 正 数 , 现 有 : 
KROW:) = [ u fw dw 

= | fü) dw + | (u) du + | ruya 
一 的 -ő ë 

= | wf) du + | w fiw) de 
-æ 下 

>8 | [ flw)dw+ | fw)du | 

=F Pr( | Wi >ë) (15.48) 


其 中 ,第 一 个 等 式 是 E( W BE X 85 ASK BUY Bj ya T EAE A 
一 个 不 等 式 成 立足 因为 被 去 掉 的 项 是 非 负 的 ;第 二 个 不 等 式 成 立 是 因为 在 积分 区 间 上 w > 





全 ;而 根据 Pr{ Fi 25) 的 定义 ,最 后 一 个 等 式 成 立 。 将 W =V -u 代 人 到 最 后 一 个 表达 式 
HESE) =E[(V-u,) ] =var( 扑 ,并 重新 整理 , 便 得 到 不 等 式 (15.47 ) 。 如 果 了 是 
离散 的 ,那么 用 求 和 代替 积分 ,这 个 证 明 仍 适用 。 
Cauchy-Schwarz 不 等 式 

Cauchy-Schwarz 不 等 式 是 考虑 到 了 非 零 均值 的 相关 系数 不 等 式 1pyy | 所 1 的 扩展 。 
Cauchy-Schwarz 不 等 式 为 : 

IECXYY | VEX ECY Y) (Cauchy-Schwarz 不 等 式 ) (15.49) 

不 等 式 (15. 49) 的 证 明 类 似 于 附录 2 1 中 的 相关 系数 不 等 式 的 证 明 。 设 开 = 了 +8X, 其 中 纠 
ERR, IA ECW) = E(Y') +2bE(XY) +6 E(X), MER b= - E(XY)ZE(X') ,于 是 
《经 简化 后 ) 该 表达 式 变 为 及 了 本) =E) - [EOT EO) AFE W) AA W 
20), BABAL LEAN EELE), TE, MARFA REBT Cauchy-Schwarz 不 
等 式 。 


[附录 15.3 高 斯 一 马尔 可 夫 定 理 的 证 明 - 


我 们 先 来 推导 对 于 所 有 的 线性 无 信 估 计量 都 成 立 的 一 些 事实 , 即 对 于 所 有 满足 公式 
(15.25) 和 公式 (15.26) 的 估计 量 房 的 一 些 事实 。 HY, =A +B X. +u RAR = Yay, 
并 合并 同 奖项 ,得 ， 

R =el F «)+B( Ea)+t È a,u, (15.50) 
祖 据 第 一 个 高 斯 一 马尔 可 夫 条 件 ,E( Yau 1 XX) = $ aE, X...) =0, 因 
此 ,对 公式 (15. 50) 的 两 这 同时 取 条 件 期 望 , 便 得 到 E( 记 0，… ,XX ) = A È a) + 


Bi( 立 o 工 ) ,由 于 根据 候 设 记 是 条 件 无 偏 的 ,因此 ,必然 有 (六 a) +B ( Y aX.) =B。 We ~ 
i=l =l r= E 
但 是 ,要 使 该 等 式 对 所 有 的 8。 和 6, 都 成 立 , 且 使 房 是 条 件 无 偏 的 ,必须 有 : usb) 
Ya = 0, Sox, =1 {15. 51) a 


在 高 斯 一 马尔 可 穴 条 件 下 U X X. SRSA 的 方差 具有 简单 的 形式 。 将 公式 (15. 51) 
代入 公式 (15. 50) ,得 记 - B, = $ auo 因此 ，var( 记 | X, X) = var( 之 Gul X... 


X.) = Y Yaacov(u ui XY,…, 和 4) ,应 用 第 二 个 和 第 三 个 高 斯 一 马尔 可 天 条 件 ,双重 求 和 
中 的 交叉 项 消失 ,从 而 ,条 件 方差 的 表达 式 简化 为 : 
var( 记 | 和 下 = 2Sa (15.52) 
注意 ,公式 (15.51) 和 公式 (15. 52) 适 用 于 公式 (15.27) 中 给 出 的 权重 a, =å, KRI Ó, , 
现在 我 们 证 明 , 公 式 (15. 51) 中 的 两 个 约 更 条 件 和 公式 (15. 52) 中 的 条 件 方差 表达 式 意 


RED 的 条 件 方差 大 于 启 的 条 件 方差 ,除非 记 Âo Ra =a, +d, W >: = > (a: + 
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多 元 回归 理论 x 





本 章 对 多 元 回归 分 析 理 论 做 了 一 个 基本 揭 介 绍 。 本 童 有 三 个 目标 。 第 一 个 目标 是 给 出 
多 元 回归 较 型 的 矩阵 形式 表示 , 它 生 成 了 OLS 个 计量 和 检验 统计 时 的 简洁 公式 。 第 二 个 目 
标 是 刻画 大 样本 条 件 下 (使 用 渐 近 理论 )OLS 估计 量 的 抽样 分 布 和 刻画 小 拜 本 条 件 下 (如 果 
误 闫 是 同方 差 的 且 服 从 正 态 分 布 时 )OLS 估计 量 的 抽样 分 布 。 第 三 个 目标 是 研究 多 元 回归 
模型 系 教 的 青 效 估计 理论 ,并 介绍 广义 最 小 二 素 法 (GLS)。GILS 方法 是 当 误 差 是 异 方差 的 
和 /或 误差 在 不 同 的 观测 值 之 间 相 关 时 有 效 地 估计 回归 系数 的 一 种 方法 。 

本 章 首 先 在 16. 1 节 列 出 用 婚 阵 形式 表示 的 多 元 回归 模型 和 OLS 估计 量 。 这 一 节 还 给 
出 了 多 元 回归 模型 扩展 的 最 小 二 来 假设 。 前 四 个 假设 与 重要 概念 15.4 PARAR 
相同 ,这 些 假设 构成 了 用 来 证 明 第 5 章 中 所 描述 的 方法 是 合理 的 那个 渐 近 分 布 的 基础 。 其 
余 两 个 扩展 的 最 小 二 杰 假 设 更 强 , 克 诗 我 们 可 以 更 加 详细 ,深入 地 探讨 多 元 回归 模型 中 QIS 
估计 量 的 理论 性 质 。 

楼 下 来 的 三 节 考 察 了 OLS 估计 重 和 检验 统计 量 的 袖 祥 分 布 ，16. 2 节 给 出 了 在 重要 概 
念 5.4 的 最 小 二 乘 假设 下 OLS 估计 量 和 上 统计 量 的 渐 近 分 布 。16. 3 节 统 一 并 归纳 了 $5.7 节 
和 55. 人 8 节 中 所 给 出 的 涉及 多 个 回归 系数 的 假设 检验, 并 且 给 出 了 相应 的 下 统计 量 的 渐 近 分 
布 。 在 16.4 节 ,我 们 研究 了 在 误差 项 是 同方 差 的 且 服从 正 态 分 布 的 特殊 请 况 下 ,9OLS 估计 
和 旺 和 检验 统计 量 的 精确 抽 禅 分布。 尽管 在 大 多 数 经 济 计 量 学 应 用 中 ,同方 差 正 杰 误 盖 的 假 
证 似 乎 是 不 会 理 的 ,但 是 精确 的 抽样 分 布 具 有 理论 上 的 意义 ,根据 这 些 分 布 计算 的 p 值 也 经 
常 出 现在 回归 款 件 的 输出 结果 中 ， 

最 后 两 节 转 向 多 元 回归 弄 型 系数 的 有 效 估计 理论 的 研究 。16.5 节 将 高 斯 一 马尔 可 去 
定理 推广 到 多 元 回归 的 情形 。16.6 节 提 出 了 广义 最 小 二 乘法 (GILS) 。 

必要 的 副 学 知识 。 本 章 对 线性 模型 的 处 理 使 用 了 上 天 阵 特 号 和 线性 代数 的 基本 工具 ,并 
假定 读者 已 修了 线性 代数 的 入 门 课程 。 附 录 16.1 复习 了 本 章 中 用 到 的 向 量 、 和 给 阵 以 及 手 阵 
运算 等 相关 知识 。 此 外 ,16. 1 节 要 用 多 元 徽 积分 的 知识 推导 01S 估计 量 。 








J61 用 给 隆 符号 表示 的 线性 多 元 回归 模型 与 OIS 信 计量 
多 元 线性 回归 模型 和 OLS 估计 量 都 可 以 利用 矩阵 符号 进行 简洁 地 表示 。 


16. 1.1 用 惩 阵 符号 表示 的 多 元 回归 模型 
总 体 多 元 回归 模型 ( 见 重要 概念 5. 2) 是; 


Y, = 应 +8 X, +B, X, 本 +B.x,. +u, i= 1 + (16. 1 ) 
=H BJ OR E E FA aK Ai EE ; 
Y, ü, l X, oe Aa X, B. 
Y. 1 X, = XY , 
了 =| “| 了 = -| 上 p= ñ (16.2) 
Y, Ha l X, — Än K, Bı 


WEY Anxi, X nx (k+1),U Hax BRG +) x1。 所 有 的 给 阵 和 向量 都 是 用 黑 
体 字 吉 示 的 ,在 这 种 符 导 下 : 
mY 是 因 变 基 的 = 个 观测 值 的 nx1 维 向 量 。 
WX E k+1 个 回归 因子 (包括 截 距 的 “常数 "回归 因子 ) 的 个 观测 值 的 x {x+1) 阶 
ER. 
Ekl) x1 Ena X. R k+1 AESAAT ARNE, R X Ss X, -- 
XAF L'EI X, HRE 
NU 是 个 误差 项 的 nx1 维 向 量 。 
WG 是 上 +1 个 未 知 回归 系数 的 {E+1) < 1 维 向 量 。 
对 第 i 个 观测 值 ARAARA MX, 表示 的 多 元 回归 模型 (16. 1) 可 写 为 ， 
V =X +u ,i=1l, ,rn (16.3) 
在 公式 (16.3) 中 ,第 一 个 回归 因子 是 "常数 ”回归 因子 , 它 总 是 取 值 为 1, 它 的 系数 就 是 截 
距 。 因 此 , 截 距 不 单独 出 现在 公式 (16. 3) 中 ,而 是 作为 系数 向 量 8 的 第 一 个 元 素 出 现 。 
将 方程 中 的 全 部 个 观测 信和 整合 在 一 起 , 便 得 到 用 和 矩阵 形式 表示 的 多 元 回归 模型 : 
Y=-xg +U (16.4) 


16.1.2 扩展 的 最 小 二 乘 假设 


多 元 回归 模型 的 扩展 的 最 小 二 葬 假 设 包括 重要 概念 5.4 中 多 元 回归 模型 的 四 个 最 小 二 
乘 假设 ,以 及 另外 两 个 关于 同方 差 和 误差 服从 正 态 分 布 的 假设 。 当 我 们 研究 OLS 佑 计量 的 
有 效 性 时 ,需要 用 到 同方 差 很 设 ; 当 我 们 研究 OL 估计 量 和 检验 统计 量 的 精确 抽样 分 布 时 ， 
需要 用 到 正 态 人 性 假设 。 

扩展 的 最 小 二 乘 假设 在 重要 概念 16. 1 中 总 结 。 


重要 概念 16. 1 





多 元 回归 模型 中 扩展 的 最 小 二 乘 假设 


合 有 多 个 回归 因子 的 线性 回归 模型 是 ， 
了 =X, B +u, i=l, e,n (16.5) 





扩展 的 最 小 二 乘 假设 为 : 


l. E(u, |X.) =0(u, 共有 条 件 零 均 值 ) ; 

2. (X Y) ,i=1,…,n 是 取 自 它们 的 联合 分 布 的 独立 间 分 布 (i. i d. ) 抽 样 ; 

3.X Ñu, 具有 非 鹤 的 ,有 限 的 四 阶 矩 ; 

4. 互 是 列 满 秩 的 (不 存在 完全 多 重 共 线性 ) ; 

5.var(u 1X,) =as( 同 方差 性 ); 

6. EX, 条 件 下 的 条 件 分 布 是 正 态 的 ( 正 态 误差 )。 

除了 符号 不 同 外 ,重要 概念 16.1 中 的 前 三 个 假设 与 重要 概念 5.4 中 的 前 三 个 很 设 完全 
相同 。 

重要 概念 5.4 和 重要 概念 16. 1 中 的 第 四 个 假设 看 上 涛 似乎 有 所 不 同 ,但 事实 上 它们 是 
一 样 的 ,它们 只 是 在 表述 不 存在 完全 多 重 共 线 性 上 的 方式 不 同 而 已 。 回 想 一 下 , 当 一 个 回归 
因子 能 被 表示 为 其 他 回归 因子 的 完全 线性 组 合 有 时 ,就 会 出 现 完 全 多 重 共 线性 。 用 公式 
(16. 2) 的 矩阵 符号 表示 ,完全 多 重 共 线 性 就 是 指 政 的 一 列 是 亚 的 其 他 列 的 完全 线性 组 合 ， 
但 是 如 果 事 实 果 真如 此 ,那么 下 不 是 列 满 秩 的 。 因 此 说 蕊 的 秩 为 天 +1, 即 秩 等 于 天 的 列 
数 ,这 是 说 这 些 回归 因子 不 是 完全 多 重 共 线 的 男 外 一 种 方式 。 

重要 概念 16. 1 中 的 第 五 个 最 小 二 乘 假 设 是 ,误差 项 是 同方 差 的 ;第 六 个 假设 是 ,给 定 
X, Fu 的 条 件 分 布 是 正 态 的 。 这 两 个 假设 与 重要 概念 15. 1 中 的 最 后 两 个 假设 相同 ,只 是 
这 里 是 针对 包 个 回归 因子 来 说 的 。 

{的 均值 向 明和 和 浴 广 关 阵 的 会 义 。 重 要 概念 16 1 的 最 小 二 乘 假设 , 隆 售 了 在 给 定 回归 
因子 天 的 矩阵 下 ,5 的 条 件 分 布 的 均 信 向 量 和 协 方差 朱 阵 锥 简单 表达 式 ( 附录 16. 2 中 给 出 
了 随机 变量 向 量 的 均值 向 量 和 协 方差 矩阵 的 定义 )。 且 体 来 说 ,重要 概念 16. 1 中 的 第 一 个 
和 第 二 个 假设 隐 售 着 Eu IX) = E(w 1X) =0, EXT iZ#;,# cov(u u, LX) = E(uu | X) = 
E(uu, X X)=E(u X )E(u X) =0( 见 练习 15.7) 。 第 一 个 S 4 RI h PRESS S 
着 E(w IX) = FE( X) =o, Gate, RTA: 

在 假设 1 和 假设 2 下 ,EF(UIX) =0, (16.6) 
在 假设 1 .假设 2 和 和 假设 5 下 ,EF(UD'IX} = out, (16.7) 
其 中 ,0, Ë n ERARE, L 是 nxn 阶 单位 阵 。 

闻 样 ,重要 概念 16. 1 中 的 第 一 个 .第 二 个 .第 五 个 和 第 六 个 假设 意味 着 ,以 王 为 条 件 的 
n 维 随机 向 量 U 的 条 件 分 布 是 多 元 正 态 分 布 { 定 义 见 附录 16.2) BB: 

在 假设 1 .假设 2 .假设 5 MERS F, AAE X,U 的 条 件 分 布 是 入 (0, oL) (16.8) 


16.1.3 ”OLS 估计 量 


OLS 估计 量 使 预测 误差 平方 和 Y (Y, = b, - bX, — = = bX.) 最 小 (表达 式 (5.8))， 
=L 


OLS 估计 量 的 公式 可 以 通过 以 下 步骤 获得 :首先 , 求 预测 误差 平方 和 对 系数 向 量 中 每 个 元 素 


的 导数 ;其 次 , 令 这 些 导数 为 零 ;最 后 , 解 出 这 些 估计 量 记 。 
对 于 /=0,… ,预测 误差 平方 和 关于 第 j 个 回归 系数 的 导数 是 : 


+Y (也 和 (16.9) 
了 “= 1= 


其 中 ,对 于 j=0 和 所 有 的 i, 有 X=1。 公 式 (16.9) 右 边 的 导数 就 是 +1 EE -2A (Y - 
了 好) 的 第 j 个 元 素 , 其 中 ,b H b... b, 组 成 的 上 +1 维 向 量 。 这 样 的 导数 共有 +1 个 ,每 








一 个 对 应 于 的 一 个 万 素 。 联 合 起 来 , 令 每 一 个 导数 等 于 零 , 便 得 到 了 +1 个 方程 系统 ,这 
就 构成 了 OLS 佑 计量 的 一 阶 条件 , 从 而 定义 了 OLS 估计 量 后 , 即 房 是 如 下 上 +1 个 方程 系统 
的 解 ， 





X'(Y-XB)-0,., (16.10) 
BR .X'Y=- Y'X 8. 

解 方程 系统 (16. 10) 便 得 到 了 用 矩阵 形式 表示 的 OLS 估计 量 户 ， 

B=-(X'y) 'X'Y (16. 11° 
HP, (XX) ARER X'X M, 

“AECE S PRE II. EEES 16.1 中 的 第 四 个 最 小 二 乘 假 设 表明 ,天 是 
列 满 秩 的 。 反 过 来 这 又 意味 着 ,矩阵 生生 是 满 秩 的 , 即 站 是 非 奇异 的 。 由 于 X'X RIE 
媒 的 ,因此 它 是 可 逆 的 。 所 以 ,不 存在 完全 多 重 共 线 性 这 个 假设 确保 了 (于 下 ) 存在 .使 得 
ARG 10) 具有 惟一 解 ,这 样 才 能 够 计算 OLS 估计 量 的 公式 (16. 11) 。 换 句 话 说 ,如 果 壮 
不 满足 列 满 秩 ,公式 (16.10) 便 没有 惟一 解 , 而 且 X' 半 是 奇异 的 , 因此 ,不 能 够 计算 


(X'X) ,也 不 能 根据 公式 (16. 11) 计算 请 。 


6.2 __OLS 估计 量 和 :统计 量 的 渐 近 分 布 ] 


如 打样 本 容量 很 大 ,而 且 满 足 重要 概念 16. 1 中 的 前 四 个 假设 ,那么 OLS 估计 量具 有 一 
个 源 近 的 联合 正 态 分 布 , 协 方差 矩阵 的 异 方差 稳健 的 估计 量 是 一 致 的 , 异 方差 稳健 的 OLS: 
统计 量具 有 浙 近 的 标准 正 态 分 布 。 这 些 结论 利用 了 多 元 正 态 分 布 ( 见 附录 16.2) 和 中心 极 
限定 理 的 一 个 多 元 扩展 式 。 


16.2.1 多 元 中 心 极限 定理 


重要 概念 2. 7 中 的 中 心 极限 定理 适用 于 一 维 的 随机 变量 。 为 了 推导 后 各 元 素 的 联合 源 
近 分 布 ,我们 需要 推导 一 个 适用 于 向 量 值 的 随机 变量 的 多 元 中 心 极限 定理 。 

多 元 中 心 极限 定理 将 单 变量 中 心 极限 定理 扩展 到 一 个 向 量 值 的 随机 变量 W 的 观测 值 
平均 数 ,这 里 的 WW 是 m 维 向 量 。 一 个 标量 的 中 心 极 限定 理 与 一 个 向 量 值 的 中 心 极限 定理 
的 区 别 , 是 方差 的 条 件 不 局 。 在 重要 概念 2.7 中 的 标量 情形 下 ,要求 方 差 既 是 非 零 的 ,又 是 
有 限 的 。 在 向 量 情形 下 ,要 求 协 方差 矩阵 是 正定 的 和 有 限 的 。 如 果 向 量 值 随机 变量 四 具有 
有 限 正定 的 协 方差 阵 ,那么 对 于 任意 非 零 的 mm 维 向 量 c, 有 0<var(e'W) <o ( 见 练 
3] 16.3). 

重要 概念 16. 2 中 对 我 们 将 要 用 到 的 多 元 中 心 极限 定理 给 出 了 严密 的 陈述 。 


重要 概念 16. 2 








多 元 中 心 极限 定理 


E[(W, -py) (Wpw)'] =E, RF, y, EESHA RM. #w=-1 Y W., Ava (W 





-a u) SN(0. Fu) 


Hp, Sp E Y RB U) 3638. 
16.2.4 预测 效应 的 置信 区 间 

6, 1 节 给 出 了 天 种 计算 两 个 或 两 个 以 上 回归 因子 变化 带 来 的 预测 效应 标准 误 的 方法 - 
这 些 标 准 误 有 简洁 的 矩阵 表达 式 ,从 而 预测 效应 的 置信 区 间 也 可 用 这 种 简洁 的 秆 阵 形式 
表示 。 

考虑 回归 因子 的 第 i 个 观测 值 从 某 个 初始 值 ( 如 互 ,变化 到 另 一 个 新 值 { 如 下 。+ 丰 ， 
因此 ,的 变化 为 AX, =d, th d H k+l EAE, 站 的 这 一 变化 可 能 涉及 多 个 回归 因子 
(BH X, 的 多 个 元 素 ) 。 例 如 ,如 果 回 归 因 子 中 的 两 个 ,一 个 是 某 一 自 变量 的 值 , 另 一 个 是 该 
自 变量 平方 的 值 ,那么 4 就 是 这 两 个 变量 的 初始 值 和 变化 后 的 值 之 差 。 

X, 的 这 种 变化 的 期 望 效 应 是 d'8, 这 个 效应 的 估计 量 是 4d 和。 由 于 正 态 分 布 随机 变量 的 
线性 组 全 本 身 仍然 服从 正 态 分 布 ,因此 ,yr (df - B) sn (6 -Bp)—N(0. 
d'I agpd) 。 所 以 ,这 个 预测 效应 的 标准 误 是 (4d' 训 294)!。 于 是 ,这 个 预测 雍 应 的 95% lJ 


置信 区 间 是 : 
d'B + 1.96 /d' 5; (16, 19) 


16.2.5 :统计 量 的 渐 近 分 布 


EEAS S 6 给 出 了 利用 公式 (16. 18) 中 的 异 方差 稳健 的 标准 误 构 造 的 检验 零 假设 局 
=B H tHE. 统计 量 服 从 渐 近 标准 正 态 分 布 的 这 个 争论 ,类 似 于 15.3 节 中 给 出 的 关 
于 单个 回归 因子 模型 的 争论 。 





16.3 联合 假设 的 检验 - 


5.7 节 考 上 谍 了 涉及 多 个 约束 条 件 的 联合 假设 的 检验 ,其 中 ,每 个 约束 条 件 涉及 一 个 系 
数 , 而 5.8 节 考 察 了 涉及 两 个 或 两 个 以 上 系数 的 单一 约束 条 件 的 检验 。16. 1 节 的 矩阵 设置 
可 以 将 这 两 种 类 型 的 假设 统一 表示 为 对 系数 向 量 的 线性 约束 ,在 这 里 ,每 个 约束 可 以 涉及 多 
个 系数 。 在 重要 概念 16. 1 中 的 前 四 个 最 小 二 乘 假设 下 ,检验 这 些 假 设 的 异 方差 稳健 的 
OLSF 统计 自在 零 假设 下 服从 F o 渐 近 分 布 。 


16.3.1 用 矩阵 表示 的 联合 假设 


考 碟 一 个 联合 假设 :系数 是 线性 的 ,并 且 施 加 ? 个 约束 条 件 ,其 中 9 所 +1。9 个 约束 中 

的 任何 一 个 都 可 能 涉及 一 个 或 多 个 回归 系数 。 这 个 联合 的 去 假设 可 以 用 符 阵 符号 写 为 : 
Fp =F (16.20) 

其 中 ,是 一 个 行 满 秩 的 gx (k+1) 的 非 随机 矩阵 ,r 是 一 个 非 随 机 的 9 x 1 向量。 有 的 行 数 
为 9g, 它 是 零 假 设 下 所 施加 的 约束 条 件 个 数 。 

公式 (16. 20) 中 的 零 假设 包含 了 5.7 节 和 5.8 节 中 所 考虑 的 所 有 零 假设 。 例 如 ,5.7 节 
中 所 考虑 的 一 类 联合 零 假 设 是 8。=0,B, =0,…,B,_! =0。 要 将 这 个 联合 假设 写成 公式 
(16. 20) 的 形式 ,只 需 令 R=[I0x0v-o] 和 r= 即 可 。 

公式 (16.20) 中 的 这 种 公式 化 表示 同样 捕 握 了 5.8 节 中 涉及 多 个 回归 系数 的 约束 条 
作 。 例 如 ,如 果 大 =2 ,那么 只 需 令 有 =[011],r=1 和 9=1l, 假 设 8 +B, =1, 就 可 以 写成 公 











p 


式 (416.20) 的 形式 。 


16.3.2 已 统计 量 的 渐 近 分 布 
检验 公式 (16. 20) 中 的 联合 假设 的 异 方差 稳健 的 正统 计量 为 ; 


F=(RB -rY (RR) "(RB -rg (16.21) 
如 果 重 要 概念 16.1 中 的 前 四 个 假设 成 立 ,那么 在 等 假设 下 : 
FOF (16. 22) 


q% 


把 的 渐 近 正 态 性 和 协 方差 阵 的 异 方差 稳健 的 人 计量 部 的 一 致 往 相 结合 , 便 可 得 到 这 
一 结果 。 具 体 来 说 ,首先 注意 公式 (16. 12) 和 附录 16.2 中 的 公式 (16. 48) 意 味 着 ,在 零 假设 


F ARĜ -r) =/aR(Ó -B) NO, RE pgp R). MARG. 51) T4, EZRET, 
(RÊ ~r)" (R SGR) (RÊ ~r) = [VaR (Â -p) VIRE e PR] ARI -B)]— 2, 
RT AA Éni- E ng- ,由 Slutsky 定理 可 得 ,[ VaR(B -8) VUR Sag- V [TV 
(É -0)— Y REN 3; = 多 Rn) ,太一 oY/4, 它 反 过 来 仍然 服从 F, 分布。 


16.3.3 多 元 系数 的 置信 集 


正如 5. 9 节 中 所 讨论 的 ,有 的 两 个 或 两 个 以 上 元 素 的 浙 近 有 效 的 置信 和 集 ,可 以 构造 为 在 
零 假 设 下 不 能 被 矿 统 计量 拒绝 的 值 的 集合 。 原 则 上 ,这 样 的 集合 可 以 通过 对 多 个 值 重复 
估计 下 统计 景 的 值 来 计算 。 但 是 ,和 单个 系数 置信 区 间 的 情况 一 样 ,要 获得 该 置信 集 的 一 
个 显 性 公式 ,变换 该 检验 统计 量 的 公式 是 很 简单 的 。 

下 面 给 出 构造 的 两 个 或 多 个 元 素 的 置信 集 的 程序 。 设 6 表示 g IE, E H K 
对 其 构造 置信 集 的 回归 系数 所 组 成 。 例 如 ,如 果 我 们 要 对 回归 系数 B, MA 构造 置信 集 , 那 
么 gq=2, 且 = (BB,)'。 MOEH, RINT S =Rp, JEF SEFER a 0 和 1 组 成 (如 在 公式 
(16. 20) 后 面 所 讨论 的 )。 检 验 假 设 5 =66 的 正统 计量 是 下 = (Š -6,)'(R ŠSçR') '(Š -' 
60)/9g, 其 中 6 =R B, 6 的 一 个 05% 的 置信 和 集 是 不 能 被 统计 量 拒绝 的 而 值 的 集合 , 即 当 6 
=RB 时 ,6 的 一 个 95 名 的 置信 和 集 是 ; 

16:(6 -6) (RÈR) (Š -6) /gel (16.23) 

其 中 ,ec 是 FF。 分 布 的 第 95 个 百 分 位 数 (5 名 的 临界 值 ) 。 

当 表 达 式 (16.23) 中 的 不 等 式 变 为 等 式 时 ,表达 式 (16. 23 ) 中 的 集合 由 该 椭圆 内 所 有 的 
点 构成 ( 当 g >2 时 ,这 是 个 椭 球 ) 。 因 此 ,6 的 置信 集 可 以 通过 求解 表达 式 (16. 23) 的 椭圆 
边界 得 到 。 





16.4 ”含有 正 态 误差 的 回归 统计 量 的 分 布 
在 样本 容量 很 大 时 ,通过 大 数 定律 和 中 心 极 限定 理 确立 的 16.2 节 和 16.3 节 中 给 出 的 
分 布 是 适用 的 。 但 是 ,如 果 以 亚 为 条 件 的 误差 是 同方 差 的 上 且 服从 正 态 分 布 ,那么 以 下 为 条 
件 的 DOLS 咎 计量 最 从 多 元 正 态 分 布 。 另 外 ,该 回 妇 标准 误 平 方 的 抽样 分 布 , 与 自由 度 为 靖 - 








D 可 以 跑 过 本 节 , 不 会 影响 内 容 的 连续 性 ， 








k-11 的 卡 方 分 布 成 比例 , 仅 适 用 于 同方 差 的 OLS 统计 量 服从 自由 度 为 一 -1 的 学 生 上 分 
布 ,而 仅 适 用 于 同方 差 的 统计 量 服 从 FF, ;分 布 。 下 面 先 给 出 本 节 讨 论 OLS 回归 统计 
基 将 用 到 的 一 些 特殊 的 矩阵 公式 。 


16.4.1 OLS 回归 统计 量 的 矩阵 表示 


OLS 预测 值 . 残 差 以 及 残 差 平方 和 具有 简洁 的 矩阵 表示 。 这 些 算 阵 表 示 利 用 了 两 个 算 
Ë: P, 和 My。 
Hi P. 和 由, 。 儿 元 回归 模型 中 OLS 的 代数 运算 依赖 于 两 个 对 称 的 n x n MER Py 
和 My: 
Py =X XX) !X' (16.24) 
M, =L, -Py (16.25) 
ME C 是 平方 形式 的 ,日 CC = C , BZ H E C ERS idempotent) 阵 。 由 于 P, =P,P, ,M, 
=MrMy( 见 练习 16.5) ,又 由 于 P, 和 M, 是 对 称 的 ,因此 ,Px 和 M, 是 对 称 的 里 等 阵 。 
直接 根据 公式 {16. 24) 和 公式 (16. 25) 中 给 出 的 定义 ,矩阵 Pr 和 M, 具有 另外 一 些 有 
用 的 性 质 ; 
P,X=X.M,X=0,.a. n srank( Py) =k+l1,renk( My) =n-k-1 (16.26) 
其 中 ,rank( Py) 是 Py 的 秩 。 
矩阵 P, 和 M, 可 以 将 一 个 n 维 向 量 Z 分 解 为 两 部 分 :一 部 分 被 革 的 列 向 量 横 穿 ,~ 部 
分 与 至 的 各 列 问 基 正 交 。 换 句 话说 ,PxZ 是 也 在 三 列 向 量 所 横 跨 的 空间 上 的 投影 ,WxZ 是 
Z 与 时 各 列 向 量 正 交 的 部 分 。 
OLS 预测 值 和 残 关 。 对 于 OLS 预测 值 和 残 差 , 集 阵 P, 和 M, 给 出 了 一 些 简 单 的 表达 
$. OLS HW P = X ñU1E OLS RA Ü =Y -他 可 被 表示 为 ( 见 练习 16.5): 
P= PY (16.27) 
Ü =-M.Y = MU (16.28) 
利用 公式 (16. 27) 和 公式 (16. 28) 中 的 表达 式 可 以 很 简单 地 证 明 , OLS 残 差 和 预测 值 是 
正 交 的 , 即 公 式 (4. 58) RQ an FÔ =YP, MY =0, 这 里 第 二 个 等 式 根据 Pr My = 得 到 ， 
反 过 来 它 又 是 根据 表达 式 (16. 26) 中 的 M.X=0,.... 18305. 
回归 的 标准 误 。 在 5.40 节 中 所 定义 的 SER 为 好, 这里; 


1 na l 1 
i = 1 = 'U = ' 16. 29 
5i TIA” n kiU Y pop- 1V MU | ) 











其 中 ,最 后 一 个 等 式 成 立 是 自 于 Ü'Ü = (M,U)'(M,U) =U'M,M,U = U'MyU 得 到 (因为 
M, 是 对 称 且 震 等 的 ) 。 


16.4.2 ”含有 正 态 误差 的 且 的 分 布 
HT =p + (X'X) "XU( 见 公式 (16.14)) ,而 且 根 据 假设 ,以 X 为 条 件 的 如 的 分 布 
为 N(0, ,021)( 见 表达 式 (16.8)) EHAE X F E 的 条 件 分 布 是 均值 为 B 的 多 元 正 态 分 


布 。 以 针 为 条 件 的 户 的 协 方差 矩阵 为 33x =E[ (8 -pB) (8 -p)'IX] sE[ (XX) 'X'UU'X 
(XX IK] = (HXU XXX) =a?(X' 革 ) 一 。 因 此 ,在 重要 概念 16. 1 中 的 所 


有 六 个 假设 下 ,给 定 天 下 房 的 条 件 分 布 是 


B - NB Ip) RP, Epro) (16.30) 


16.4.3 ”ss 的 分 布 


如 果 重 要 概念 16. 1 中 的 所 有 六 个 假设 都 成 立 ,那么 只 具有 精确 的 抽样 分 布 ,这 个 分 布 
HAREA n-k-1 的 卡 方 分 布 成 比例 , 即 : 


1) (16.31) 
证 明 表达 式 (16. 31) 需 要 从 公式 (16. 29) JF, AA U E ADA X ARRES, 
LAA M, 为 对 称 寡 等 阵 , 二 次 型 VMU 服从 自由 度 等 于 M, 秩 的 卡 方 分 布 ( 见 附录 
16.2 中 的 公式 (16. 3 ) ) 。 由 表达 式 (16.26) 知 ,由 : 的 铁 为 二 -下 -1。 因 此 U'M, Ue, 服 
从 精确 的 x¥_,_1 分 布 ,从 而 表达 式 (16. 31) 成 立 。 
BHH BEES T 怠 是 无 偏 的 。 一 个 服从 x -分布 的 随机 变量 的 期 望 为 -下 -1 , 因 
Ee,E(U'MyU) = (n-k -1)o? ,从 而 ,E(st) = oso 


16.4.4 仅 适 用 于 同方 差 的 标准 误 
以 为 条 件 的 所 的 协 方差 矩阵 的 仅 适用 于 同方 差 的 估计 量 中 ,可 以 通过 用 样本 方差 只 
代替 表达 式 (16. 30) 中 的 号 ix 表达 式 中 的 总 体 方差 =; 得 到 ,因此 : 
ŞAD — 【( 仅 适用 于 同方 差 的 ) (16.32) 
AEX FE 的 正 态 条 件 分 布 方差 的 估计 量 是 OUDER, MAA, 的 仅 适 用 于 同方 
差 的 标准 误 是 DA j 个 对 角 元 素 的 平方 根 , 即 记 的 仅 适用 于 同方 差 的 标准 误 是 : 
SE(8) =V (器 )，( 仅 适用 于 同方 差 的 ) (16. 33) 


16.4.5 i 统计 量 的 分 布 
设 i 为 检验 假设 B =B,o 的 :统计 量 , 它 是 利用 仅 适用 于 同方 差 的 标准 误 构造 的 , 即 设 : 


pÊ ba (16.34) 
N (25), 
在 重要 概念 16.1 PHARA Fb BABO REEF, i 的 精确 抽样 分 布 是 自由 度 为 


n-k-t ZE at, ll: 
s (16.35) 


对 表达 式 (16. 35) 的 证 明 在 附录 16.4 中 给 出 。 
16.4.6 天 统计 量 的 分 布 


如 果 重 要 概念 16. 1 中 的 全 部 六 个 最 小 二 乘 假设 都 成 立 ,那么 利用 协 方差 矩阵 的 仅 适 用 
于 局 方差 的 估计 量 所 梅 造 的 检验 公式 {116.20) 中 假设 的 正统 计量 ,在 零 假 设 下 服从 精确 的 
所 ,4-1 分 布 。 

仅 适 用 于 同方 莽 的 二 统计 其 。 仅 适用 于 同方 差 的 在 统 计量 类 似 于 表达 式 {(16. 21 ) e 
方差 稳健 的 正统 计量 ,不 同 的 是 ,这 里 使 用 了 仅 适 用 于 同方 差 的 估计 量 中 ,而 不 是 异 方差 稳 


健 的 估计 量 $p RER 六 = 总 (X'X) 一 代 人 表达 式 (16. 21) 中 正统 计量 的 表达 式 , 便 得 








到 检验 公式 (16. 20) 中 零 假 设 的 仅 适用 于 同方 差 的 下 统计 量 。 
p. (RB r'lROYX) R "(RA -r)/q 


L 





(16.36) 


如 果 重 要 概念 16. 1 中 的 全 部 六 个 假设 都 成 立 , 那 么 在 零 假 设 下 ，: 
FF (16. 37) 

表达 式 (16. 37) 的 证 明 在 附录 16.4 中 给 出 。 

经 验 规 则 的 下 统计 其 公式 。 公 式 (16. 36) 中 的 下 统计 量 被 称 为 Wald 形式 的 和 统计 量 
(以 统计 学 家 Abraham Wald 的 名 字 命 名 )。 尽 管 附录 5. 3 中 给 出 的 经 验 规则 的 下 统计 量 公 
式 似乎 与 公式 (16. 36) 中 的 Wad 统计 量 公式 很 不 相同 ,但 实际 上 经 验 规则 已 统 计量 和 
Wald 统计 其 只 是 同一 个 统计 量 的 两 种 形式 。 也 就 是 说 ,这 两 个 表达 式 是 等 价 的 ,进一步 的 
讨论 见 Greene( 1997 ,第 了 7 章 ) 。 


[16.5_ 含有 同方 差 误 差 的 OLS 估计 量 的 有 效 性 - 


在 多 元 回归 的 高 斯 一 马尔 可 夫 条 件 下 ,8B 的 0LS 估计 量 在 所 有 线性 条 件 无 偏 估 计量 中 
是 有 效 的 ,也 就 是 说 ,0LS 佑 计量 是 BLUE, 


16. 5.1 多 元 回归 的 高 斯 一 马尔 可 夫 条 件 


甸 元 回归 的 高 斯 一 马尔 可 夫 条 件 (Gauss -Markov conditions for multiple regression) i: 
(iECUIX) =0, 
GDE IX) == I, (16. 38) 
【 荐 ) 焉 是 列 满 秩 的 
多 元 回归 的 高 斯 一 马尔 可 去 条 件 反 过 来 被 重要 概念 16. 1( 见 表达 式 (16.6) 和 表达 式 
《16.7) 中 的 前 五 个 假设 所 隐 含 。 表 达 式 (16. 8) 中 的 条 件 将 高 斯 一 马尔 可 去 条 件 由 单个 回 
归 因 子 情形 推广 到 多 元 情形 (通过 利用 矩阵 符号 ,将 表达 式 (15.24) 中 的 第 二 个 和 第 三 个 高 
斯 一 马尔 可 夫 条 件 合并 成 表达 式 (16. 38) 中 的 一 个 条 件 (ii))。 


16.5.2 线性 条 件 无 偏 估计 量 

我 们 先 找 述 线性 无 篇 估计 量 的 类 别 , 然 后 证 明 OLS 属于 此 类 。 

线性 条 件 无 偏 估 计 蜡 的 类 别 。 如 果 8 的 估计 量 是 Ye, Y, 的 线性 函数 , 则 称 该 估计 量 
是 线性 的 。 因 此 ,如 果 估 计量 记 可 以 写成 如 下 形式 ， 

B=A'Y (16.39) 
那么 它 与 了 是 线性 的 关系 。 这 里 的 4 是 一 个 可 能 依赖 于 互 和 非 随 机 常数 但 不 依赖 于 了 的 
nx (总 +1) 阶 的 权 数 上 第 阵 。 如 果 给 定 瑟 ,一 个 估计 量 的 条 件 抽样 分 布 的 均值 为 8 , 则 该 舍 计 
量 是 条 件 无 偏 的 。 也 就 是 说 ,如 果 EX) = ,那么 启 是 条 件 无 偏 的 。 

OLS 估计 景 是 线性 的 和 条 件 无 偏 的 。 比 较 公式 (16. 11) 和 公式 (16. 39) 可 知 ,该 OLS 佑 
计量 与 了 是 线性 的 关系 ,具体 地 说 ,6 =A'Y, 其 中 42=X(X'X¥)“'。 为 了 证 明 记 是 条 件 无 偏 
的 ,回想 一 下 公式 (16.14) 中 让 =B + 《X'X)“'X'U。 对 这 个 表达 式 的 两 边 同时 取 条 件 期 所 
得 E(BIX) =B +E[(X'X) 'X'UIX] =B+ (XX) 'X'E(UIX) =B, 其 中 ,最 后 一 个 等 式 根 
据 第 一 个 高 斯 一 马尔 可 夫 条 件 E(UIX) =0 得 到 。 








16.5.3 ”多 元 回归 的 高 斯 一 马尔 可 夫 定 理 

多 元 回归 的 高 斯 一 马尔 可 夫 定 理 (The Gauss - Markov theorem for multiple 
regression) 给 出 了 OES 估计 时 在 线性 条 件 无 偏 倘 计量 中 是 有 效 的 所 需 满 足 的 条 件 . 但 是 ， 
因为 户 是 个 向 量 , 而 它 的 “方差 ”是 个 协 方差 矩阵 ,所 以 ,这 里 存在 一 个 细微 的 问题 。 当 一 个 
估计 量 的 “方差 "是 个 矩阵 时 ,认为 一 个 估计 量 比 另 一 个 估计 基 揭 方差 小 ,其 含义 是 什么 呢 ? 
高 斯 一 马尔 可 夫 定 理 可 以 回答 这 个 问题 , 它 是 通过 比较 召 各 元 素 一 个 线性 组 合 的 候选 
估计 量 的 方差 与 相应 的 态 线 性 组 合 的 方差 来 完成 的 .具体 来 说 , 设 c 是 个 5 +1 维 向 量 , 考 
谍 这 样 一 个 问题 :一 方面 用 候选 的 估计 量 e 寡 ( 户 是 一 个 线性 条 件 无 偏 估 计量 ) 估计 线性 组 
S eB, 另 一 方面 用 ce 月 估 计 eB。 由 于 ec 信和 ce 硼 都 是 标量 ,同时 都 是 cB 的 线性 条 件 无 仿 
估计 其 ,因此 ,现在 比较 它们 的 方差 就 有 意义 了 。 

多 元 回归 的 高 斯 一 己 尔 可 夫 定 理 表明 ,e 才 的 0LS 估 计量 是 有 效 的 , 即 0LS 估 计量 c' 万 
在 所 有 线性 条 件 无 刁 估 计量 c 仿 中 具有 最 小 的 条 件 方差 。 值 得 注意 的 是 ,不 管线 性 组 合 的 
形式 是 什么 ,上 述 命题 都 成 立 。 正 是 在 这 个 意义 下 ,多 元 回归 中 的 OLS 估计 量 是 BLUE, 

高 斯 一 马尔 可 夫 定 理 的 陈述 在 重要 概念 16.3 中 给 出 ,并 在 附录 16.5 中 进行 了 证 明 。 


重要 概念 16. 3 





多 元 回归 的 高 斯 一 马尔 可 夫 定 理 

假设 表达 式 (16. 38) 中 多 元 回归 的 高 斯 一 马尔 可 夫 条 件 都 成 立 ,那么 0LS 估 计量 后 是 

BLUE。 也 就 是 说 , 设 房 是 8 的 一 个 线性 条 件 无 偏 估 计量 ,e 是 一 个 非 随 视 的 上 + 1 维 向 量 ， 

那么 对 于 任 一 非 零 向 量 e , 便 有 var(e 喇 1 开 ) Svale hX) 。 其 中 ,对 于 所 有 的 c 来 说 ,当年 
仅 当 记 = 启 时 ,不 等 式 中 的 等 式 才 成 立 。 


[16.6 广义 最 小 二 乘法 


独立 同 分 布 的 抽样 假定 适用 于 许多 实际 问题 。 例 如 ,假设 了 X, 对 应 于 个 体 的 信息 ， 
比如 说 人 们 的 收入 , 受 教 育 水 平和 个 人 特征 等 ,这 里 的 个 体 是 通过 简单 随机 抽样 从 总 体 中 抽 
取 的 。 在 这 种 情形 下 ,由 于 这 个 简单 随机 抽样 方案 , (XX, 了) 必然 是 独立 同 分 布 的 。 因 为 对 
Pij, (X Y A(X, YO BAA, A u, 入 也 是 独立 分 布 的 。 反 过 来 这 又 意味 
着 ,对 于 iz¥j,u, 和 是 不 相关 的 。 在 高 斯 一 马尔 可 夫 假 设 的 内 容 中 ,如 果 数 据 是 以 一 种 使 
观测 值 是 独立 分 布 的 方式 搜集 的 ,那么 假设 E( UU'IX) 是 对 角 的 这 个 结论 是 适当 的 。 

然而 ,经 济 计量 学 中 遇 到 的 许多 抽样 方案 并 不 能 保证 一 定 会 得 到 独立 的 观测 值 ,相反 会 
引致 误差 项 在 不 同 的 观测 值 之 间 是 相关 的 。 最 为 突出 的 例子 是 当 数 据 是 对 同一 个 实体 在 不 
同时 间 被 抽取 时 , 即 当 数据 是 时 间 序 列 数据 时 ,就 会 发 生 上 述 结果 。 正 如 13. 3 节 中 所 讨论 
的 ,在 涉及 时 间 序 列 数据 的 回归 中 ,许多 被 忽略 的 因素 在 前 后 期 之 间 是 相关 的 ,这 就 可 能 时 
致 回归 误差 项 ( 它 代表 了 那些 被 忽略 的 因素 ) 在 前 后 期 观测 值 之 问 是 相关 的 。 换 名 话说 , 某 











© 在 13.5 RAAR ENR PIENA AT GLS 司 计 基 。 这 里 的 这 个 介绍 是 独立 的 GLS 的 数学 处 理 ,可 独立 
于 13 5 节 来 学 习 , 但 先 学 习 那 一 节 有 助 于 使 这 些 思 想 变 得 更 消 楚 。 








一 期 的 误差 项 与 下 一 期 的 误差 项 一 般 不 会 是 独立 分 布 的 ;相反 ,一 个 时 期 的 误差 项 可 能 与 下 
一 期 的 误差 项 相关 。 

相关 误差 项 的 存在 为 基于 OLS 的 统计 推断 引 来 了 两 个 问题 。 首 先 ,由 OLS 所 产生 的 异 
方差 稳健 的 标准 误 和 仪 适用 于 同方 差 的 标准 误 都 不 能 为 统计 推断 提供 一 个 有 效 的 基础 。 解 
决 这 个 问题 的 方法 是 ,使 用 对 观测 值 之 间 误 差 项 的 蜡 方 差 和 相关 系数 间 时 稳健 的 标准 误 ， 
这 个 问题 一 一 异 方差 一 自 相 关 一 一 致 性 (HAC) 协 方差 矩阵 估计 一 一 是 13.4 节 的 主题 ,这 
里 我 们 不 打算 做 进一步 探讨 了 。 

其 次 ,如 果 误 著 项 在 观测 值 之 间 是 相关 的 ,那么 E(UU'1X) 不 是 对 角 的 ,表达 式 
(16.38) 中 的 第 二 个 高 捧 一 马尔 可 夫 条 件 不 成 立 ,从 而 OLS 不 是 BLUE。 在 本 节 , 我 们 研究 
一 个 估计 量 一 广义 最 小 二 乘 (generalized least squares, 简 写 为 GUS) , 当 误差 项 的 条 件 
协 方差 矩阵 不 再 与 单位 阵 成 比例 时 ,这 个 GLS 是 BLUE( 至 少 在 新近 音义 下 )。GLS 的 一 个 
特殊 情形 是 15.5 节 中 所 讨论 的 加 权 最 小 二 乘 , 在 堵 里 ,条 件 协 方差 矩阵 是 对 角 的 , 且 第 i 个 
对 角 元 素 是 下 MAR, A WLS 一 样 ,GLS 对 回归 模型 进行 了 变换 ,这 使 得 变换 后 的 模型 的 
误差 项 满足 高 斯 一 蕊 尔 可 夫 和 条件。 这 个 GLS 估计 量 就 是 变换 后 的 模型 中 系数 的 OLS fk 
计量 。 


16.6.1 GILS 假设 


要 使 GLS 是 有 效 的 ,需要 有 四 个 假设 条 件 。 第 一 个 GLS 假设 是 ,以 X oe X. ARIER 
m. 具有 零 均 值 , 即 : 


E(UIX) =0, {16. 40) 
这 个 假设 隐 合 在 重要 概念 16. 1 中 的 前 两 个 最 小 二 乘 假设 中 ,也 就 是 说 ,如 果 吾 (也 1 让) 
=O H(X,,Y,) i21, e,n 是 独立 同 分 布 的 ,那么 ECUIX) =0,。 可 是 ,在 GLS 中 ,我 们 并 不 


要 求 保持 这 个 独立 同 分 布 假设 ,因为 GES 的 一 个 目的 就 是 处 理 观 测 值 之 间 误差 项 的 相关 性 
问题 。 介 绍 完 CLS 佑 计量 之 后 ,我 们 将 讨论 公式 {16. 和 0) 中 那个 假设 的 意义 。 

第 二 个 CLS 假设 是 ,给 定 于 条 件 下 ,也 的 条 件 协 方差 矩阵 是 天 的 某 种 函数 。 

E(UU'|X) =X} (16.41) 
FEE AOE X Bj n xn MERER 

与 这 个 假设 相关 联 的 GLS 有 两 个 主要 应 用 。 第 一 个 应 用 是 带 有 蜡 方差 误差 的 独立 抽 
样 , 其 中 (五 ) 是 个 对 角 阵 ,对 角 元 素 是 Ah( 瑟 ) ,这 里 的 A 是 个 常数 ,hh 是 一 个 函数 。15.5 
节 中 讨论 过 这 种 情形 ,结论 是 GLS 是 WES, 

第 二 个 应 用 是 针对 序列 相关 的 同方 差 误 善 项 。 实 际 上 ,在 这 种 情形 下 ,人 们 提出 了 一 种 
处 理 序列 相关 的 模型 ,例如 ,误差 项 只 与 它 相 邻 的 误差 项 相关 的 模型 ,所 以 ,eorr(z u, |) = 
pz0 ,但 是 ,如 果 旦 - 咱 =2, 那 么 cor(u u.) =0。 在 这 种 情形 下 ,2( 开 ) 对 角 线 元 素 为 C. 
第 一 个 次 对 角 线 元 素 为 po ,其 他 元 素 均 为 0。 因 此 ,J2() 并 不 依赖 于 站 ,和 2, = osi 对 于 
li -jl =1,42, =po? ;对 于 |i-j| >1,42, =0。 序列 相 关 的 其 他 模型 ,包括 一 阶 自 回 归 模 型 ,在 
13.5 节 的 GLS 内 容 中 进行 了 进一步 讨论 ( 也 可 见 练习 16. 8)。 

在 前 面 出 现 的 关于 截面 数据 最 小 二 乘 假设 所 有 假设 中 的 一 个 假设 是 ,万 Au, 具有 非 零 
HARABE., E CLS 情形 中 ,具体 的 从 假设 舌 要 根据 函数 (X) 的 性 质 来 证 明 渐 近 结 
果 。 特 定 的 绕 假 设 还 依赖 于 我 们 是 研究 CLS 估计 县 还 是 考察 + 或 严 统 计量 ,而 且 对 和 矩 的 要 
求 还 依赖 于 器 (XX) 是 否 是 已 知 的 ,或 者 说 是 否 已 合计 出 了 它 的 参数 。 因 为 这 些 假设 随 着 具 
体 情况 和 具体 模型 不 同 而 不 同 ,所 以 ,在 此 我 们 不 打算 给 出 具体 的 托 假 设 。 关 于 GLS 大 样 


本 性 质 的 讨论 ,假设 这 样 的 矩 条 件 对 解决 我 们 且 前 的 问题 是 适合 的 。 为 完整 起 见 , 作 为 GLS 
的 第 三 个 假设 ,简单 地 假设 X. 和 u, 满足 合适 的 矩 条 件 。 

GLS 的 第 四 个 假设 是 ,XX 是 列 满 秩 的 , 即 问 归 因 子 不 是 完全 多 重 共 线 性 的 。 

GLS 的 假设 被 概括 在 重要 概念 16.4 中 。 


重要 概念 16. 4 
GLS 假设 
在 线性 回归 模型 了 Y= AXB +U h RB) GLS 假设 是 : 
L E(UIX) =0,; 


2. E(UU' IX) =X) RP RUO ET] 8EfKE F X B n x n 正定 矩阵 ; 

3, X, 和 六 W ES 938 28 PF; 

4. 所 是 列 满 秩 的 (不 存在 完全 多 重 共 线性 )。 

我 们 分 两 种 情况 分 析 GLS 竺 计 。 第 一 种 情况 ,2(X) 是 已 知 的 。 第 二 种 情况 ,人 (XY) 的 
函数 形式 是 已 知 的 ,其 中 的 参数 可 以 估计 。 为 了 简化 符号 ,我 们 将 函数 OX) 35 J EBE 
NRE 和 对 天 的 依赖 关系 没有 被 明确 地 给 出 来 。 


16.6.2 QQ 已 知 时 的 GLS 

M EAR GLS 估计 量 利 用 如 将 回归 模型 变换 成 一 个 误差 项 满足 高 斯 一 马尔 可 夫 条 
件 的 模型 。 具 体 地 说 , 设 五 为 弛 -1 的 矩阵 平方 根 , 即 设 忆 是 个 满足 FF =A 的 矩阵 [这样 
的 矩阵 总 是 存在 的 ) 。 严 的 一 个 性 质 是 五 "QFP = 工 。 现 在 公式 (16.4) 的 两 边 同 时 前 乘 F, 
得 到 ; 


A 


?p+ (16.42) 
Jeh,Y=-FY,Y= FX fl Ü = FU, 

CILS 的 关键 思想 是 ,在 四 个 GLS 假设 条 件 下 ,高 斯 一 马尔 可 夫 假 设 对 公式 (16. 42) PE 
换 后 的 回归 成 立 。 也 就 是 说 ,通过 用 上 生 的 矩阵 平方 根 的 倒数 变换 所 有 的 变量 ,在 变换 后 的 
回 娄 模 型 中 ,回归 误差 的 条 件 均值 为 零 , 协 方差 矩阵 等 于 单位 阵 。 要 在 数学 上 证 明 这 一 点 ， 
首先 注意 ,根据 第 一 个 CLS 假 设 ( 见 公式 (16.40) ) ,E(ÜIX) =E(FUIFX) =FE(U| FX) = 
0, AIh, E(ÙÙ I) = E[ (FU)(FU)'IFX] =FE(UU'IFX)F' = FAF = 天 ,其 中 ,第 二 个 
等 式 可 由 (FU)' =U'F' 得 到 ,而 最 后 一 个 等 式 由 下 的 定义 得 出 。 由 此 推断 ,公式 (16.42) 中 
变换 后 的 回归 模型 满足 重要 概念 16. 3 中 的 高 斯 一 马尔 可 夫 条 件 。 

CLS 估计 量 训 5 就 是 公式 (16. 和 2) 中 8 的 OLS 估计 量 , 即 有 = (XX) OY) 。 由 于 
转换 后 的 回归 模型 满 是 高 斯 一 马尔 可 夫 条 件 ,因此 ,这 个 GLS 估 计量 是 关于 ?线性 的 最 佳 
条 件 无 偏 知 计量 ,但 是 次 为 了 =FY, 并 且 假 设 F( 在 这 里 ) 是 已 知 的 ,又 因为 F 是 可 道 的 ( 因 
为 从 是 正定 的 ) ,所 以 ,关于 字 是 线性 的 那些 估计 重 的 类 别 与 关于 了 是 线性 的 那些 估计 量 的 
类 别 相同 。 因 此 ,公式 {16. 42) 中 8 的 这 个 OLS 千 计 量 也 是 在 关于 了 是 线性 的 那些 估计 量 
类 别 中 的 最 佳 条 件 无 偏 估计 量 。 换 名 话说 ,在 GLS 假设 下 ,GLS 估计 量 是 BLUE, 

CIS 估计 量 可 以 直接 用 几 表 示 , 因 此 ,原则 上 不 需要 计算 平方 根 矩阵 下 。 六 为 寂 = Fx, 
B Ë =FY, PiL B” =(X'F'FX) !(X'F'FY), 但 是 ,F'F = 和 2 ,所 以 ; 














B= (XOX (XN) (16.43) 

实际 上 ,42 -一般 是 木 知 的 ,公式 (16. 和 ) 中 的 GLS 估计 量 一 般 是 不 可 计算 的 ,所 以 有 时 

也 称 其 为 不 可 行 的 GLS(infeasible GLS) 估 计量 ,可 是 ,如 果盘 的 函数 形式 已 知 ,但 该 孙 数 
的 参数 却 是 未知 的 ,那么 昌 能 被 合计 出 来 ,所 以 一 个 本 行 的 GIS 仿 计 量 可 以 计算 则 来 。 


16.6.3 和 从 人 包含 未 知 参数 时 的 GLS 


如 朵 旭 是 一 个 已 知 的 疯 数 , 它 的 -… 些 参数 可 以 被 估计 出 来 ,那么 这 些 佑 计 的 参数 可 用 
来 计算 协 方差 矩阵 旭 的 估计 量 。 例 如 , 考 虚 公式 (16. 41) 后 面 讨论 的 那个 时 间 序 列 的 应 用 ， 
#rh,O(X)3F 434 X. =o tli- =, f, pr}, EAN -站 >1,12,=0。 RAN 
具有 商 个 未 知 参 数 ,c: 利 p。 这 些 参数 可 以 使 用 残 差 利用 先前 的 OLS 回归 进行 估计 。 具 体 
来 说 ,可 以 用 号 估计 于, 可 以 用 相 邻 的 OLS 残 差 对 之 间 的 样本 相关 系数 估计 p。 这 些 所 全 
计 的 参数 反 过 来 又 能 被 用 来 计算 Q pisi Ó. 

一 般 地 说 ,假设 已 有 了 有 2 的 估计 量 帮 ,那么 基于 大 的 6GLS 估计 量 为 : 

BE = (16.44) 

公式 (16. 44) 中 的 GLS 估计 量 有 时 又 被 称 为 可 行 的 GLS (feasible GLS) 估 计量 。 因 为 

如 果 协 方差 给 阵 中 包含 的 一 些 未 知 参 数 可 以 被 估计 的 话 ,那么 它 就 可 以 被 计算 出 来 。 


16.6.4 条 件 零 均值 假设 与 GLS 

为 了 确保 OLS 估计 量 是 一 致 的 ,第 一 个 最 小 二 乘 假 设 必须 满足 , 即 E(u LX ) 必须 等 于 
零 。 相 比 之 下 ,第 一 个 GLS 假设 是 E(w IX... X.) =0。 换 名 话说 ,第 一 个 0LS 假设 是 ,给 
定 第 i 个 回 妇 因子 的 观测 值 ,误差 项 具有 条 件 零 均值 ,而 第 一 个 GLS 假设 是 ,给 定 回 归 因 子 
的 所 有 观测 值 ,a, 具有 条 件 零 均值 。 

如 16.1 节 中 所 讨论 的 ,假设 E(u,1X,) =0 和 抽样 是 独立 同 分 布 的 假设 合 在 一 起 ,这 意 
RA E(u lX eX) =0。 因 此 ,如 果 抽 样 是 独立 同 分 布 的 ,那么 GLS 就 是 WLS ,第 一 个 
GLS 假设 就 著 涵 于 重要 概念 16. 1 中 的 第 一 个 最 小 二 乘 假设 中 。 

然而 ,如 果 抽 样 不 是 独立 同 分 布 的 ,那么 第 一 个 GLS 假设 就 不 会 由 假设 E(u, IX) =0 
所 隐 含 , 即 第 一 个 GLS 假设 是 更 强 的 。 尽 管 这 两 个 条 件 的 区 别 看 起 来 做 乎 是 微乎其微 的 ， 
但 是 在 时 间 序列 的 应 用 中 ,这 是 非常 重要 的 。 在 13. 5 节 回 归 因 子 是 “当前 和 过 去 "外 生 的 
还 是 “ 严 " 外 生 的 内 容 中 ,我 们 曾 讨论 了 这 个 区 别 ,B(w,1X,…, 半 ,) =0 这 个 假设 对 应 于 严 
外 生性 。 现 在 ,我 们 利用 矩阵 符号 在 更 一 般 的 层次 上 讨论 这 个 区 别 。 为 此 ,我 们 集中 考虑 上 
是 同方 差 ,已 知 且 只 具有 非 零 的 非 对 角 线 元 素 的 情形 。 

第 -个 GLS 假设 的 作用 。 要 理解 这 些 假设 之 间 区 别 的 来 源 ,比较 CLS A OLS 的 一 致 性 
讨论 是 有 用 的 。 

我 们 首先 给 出 公式 (16. 43) 中 关于 GLS 估计 量 一 致 性 问题 的 讨论 。 将 公式 (16. 4) 代 人 
公式 (16.43) ,我 们 便 有 B=B + (X O'X) (XA Un), TE3— A GIS 假设 下 ， 
E(X'Q  U)=ELX'O  EC(U1X)] =0,.JEbk WRX OT U ni r 5 X 5 FZ, H 
XOXO, Eh Q ERATE, A Ae, EREE, 4 O RAIER M 
线 元 素 时 ,对 于 不 同 的 ,XQ U- Y Y XLT) u, 中 含有 X Au 的 乘积 ,其 中 ， 


+=1 jsl 


(个 ) ,表示 用 的 (让 元 素 。 因 此 ,要 使 XY"'U 具有 零 均 值 , 仪 有 E(w,1X,) =0 ETE 














的 ,对 于 所 有 对 应 于 (2 O) ,的 韭 零 值 的 i 对 元 素 , 必 须 有 Eu IX) =0。 根 据 误差 的 协 方 
差 结构 ,只 有 (02), 的 某 此 或 所 有 的 元 素 可 能 是 非 堆 的。 例如 ,如 果 服从 一 和 阶 自 回归 
(如 13.5 节 中 所 讨论 的 ) , 仅 有 的 非 零 元 素 (2 ) RIEM -jiel 时 的 元 素 。 可 是 一 般 
地 ,0 ' 的 所 有 元 素 都 可 能 是 非 零 的 ,所 以 一 般 来 说 ,要 使 X271DVAn 一 -006ww( 从 而 使 
B eio) ,我 们 需要 ECUIX) =0,, 即 第 一 个 GLS 假设 必须 成 立 。 

相反 ,回想 -下 关于 0LS 估计 量 一 致 性 的 讨论 。 将 方程 (16. 14) 重 写 为 = + 
(XXn) E Y Xu, WR ECIX) =0, 那 么 亡 Y Xu 项 具有 零 均 值 , 并 且 ,如 果 该 顶 


的 方差 趋向 于 零 BREZ TIKI kk E, WELE XXn — 0, WA fe. 

第 一 个 GLS 假设 是 有 约束 性 的 吗 ?9 第 一 个 GLS 假设 要 求 第 1 个 观测 值 的 误差 与 所 有 
其 他 观测 值 的 回归 因子 不 相关 。 这 一 假设 在 有 些 时 间 序列 应 用 中 可 能 是 值得 怀疑 的 。 这 个 
问题 在 13, 6 节 以 一 个 实证 例子 进行 了 讨论 , 即 浓缩 橙 计 期 货 交割 价格 的 变化 与 佛罗里达 州 
的 天 气 之 间 的 关系 。 正 如 那 部 分 所 解释 的 ,价格 变化 对 天 气 回归 中 的 误差 项 ,与 天 气 的 当前 
值 和 过 去 值 合理 地 不 相关 ,所 以 第 一 个 OLS 假设 成 立 。 然 而 ,这 个 误差 项 却 可 能 与 天 气 的 
未 来 值 相关 ,从 而 第 一 个 CIS 假设 不 成 立 。 

这 个 例子 说 明了 经 济 时 间 序列 中 的 一 个 普遍 现象 , 当 一 个 变量 的 当前 值 部 分 地 以 未 来 
的 预期 值 为 基础 设 定时 ,就 会 出 现 这 种 现象 。 那 些 对 未 来 的 期 望 往往 意味 着 ,今天 的 误差 项 
依赖 于 对 回归 因子 明天 的 预期 ,而 反 过 来 明天 的 这 种 预期 与 回归 因子 明天 的 实际 值 权 关 。 
出 于 这 种 原因 ,第 -个 CLS 假设 实际 上 比 第 一 个 0LS 假设 强 得 多 。 因 此 ,在 某 些 经 济 时 间 
序列 数据 的 应 用 中 ,GLS 佑 计量 不 是 一 致 的 佑 计量 ,即使 OLS 估计 量 是 一 致 的 估计 量 。 


1. 用 矩阵 形式 表示 的 线性 多 元 回归 模型 是 了 = 车 + 忌 , 其 中 ,了 是 因 变 基 观 测 值 的 = x 
1 向 车 ,了 是 让 各 +1 个 回归 因子 (包括 常数 ) 的 个 观测 值 组 成 的 nx (k +1) EBE 8 是 未 知 
参数 的 上 + 1 维 向 量 ,0 是 误差 项 的 nx1 维 向 量 。 

2. OLS 佑 计量 是 所 = (X'X) -'X' 了 。 在 重要 概念 16. 1 中 的 前 四 个 最 小 二 乘 假 设 下 ,后 是 
一 致 的, 且 服从 渐 近 正 态 分 布 。 此 外 , 如果 误差 项 是 同方 差 的 ,那么 记 的 条 件 方差 是 
var(PIX) = (XX) ', 

3. 对 及 的 一 般 线 性 约束 可 以 写成 4 个 方程 , 即 RB = ,并 且 这 个 公式 可 用 来 检验 涉及 
多 个 系数 的 联合 假设 或 构造 8 中 各 元 素 的 置信 集 。 

4. 当 以 三 为 条 件 的 回归 误差 是 独立 同 分 布 的 , 吕 服 从 正 态 分 布 时 ,B 服从 精确 的 正 态 
分 布 , 且 仅 适用 于 同方 差 的 :统计 量 和 下 统计 量 分 别 骤 从 精确 的 16_1 和 了 ,i-1 分 布 。 

5. 高 斯 一 马尔 可 夫 定 理 指出 ,如 果 误 差 项 是 同方 差 的 ,并 在 观测 值 之 间 条 件 不 相关 ,而 
且 如 果 Elu X) =0, 那 么 OLS 估计 量 在 线性 条 件 无 偏 估 计量 中 是 有 效 的 (OLS Æ BLUE). 

6. 如果 误 差 的 协 方差 矩阵 O 与 单位 阵 不 成 比例 ,并 且 如 是 已 知 的 ,或 是 可 以 千 计 的 ， 
那么 GLS 全 计量 比 OLS 估计 大 渐 近 地 有 效 。 但 是 一 般 地 说 ,GLS SR u 与 所 有 回归 因子 的 
观测 值 不 相关 ,并 且 不 像 OLS MERERI X 不 相关 ,在 实际 应 用 中 ,这 个 息 设 往往 必须 
进行 遵 秆 评价 。 








-重要 术语 , 


苦 等 的 ”多元 回归 的 高 斯 一 马尔 可 夫 条 件 ”多 元 回归 的 高 斯 一 马尔 可 夫 定 理 ”均值 向 
E 广义 最 小 二 乘 (GLS) 不 可 行 的 GLS 可 行 的 GIS 协 方差 矩阵 





[复习 概念 - 


16.1 一 位 研究 人 员 研 究 一 组 工人 的 收 人 与 性 别 之 间 的 关系 ,将 回归 模型 设 定 为 了 = 
Bo +X Bi +X,B, + 其 中 ,和 是 个 二 元 变量 ,如 果 第 :个 人 是 妇 性 ,那么 它 等 于 1; X, th E 
个 二 元 变量 ,如 果 第 i 个 人 是 男性 ,那么 它 等 于 1。 对 于 一 个 n=5 的 假设 的 观测 值 集合 ,请 
用 表达 式 (16. 2) 的 矩阵 形式 表示 这 个 模型 。 证 明美 列 向 量 是 线性 相关 的 ,因此 半 不 县 列 满 
秩 的 。 请 解释 你 将 如 何 重 新 设 定 这 个 模型 ,以 删除 完全 多 重 共 线 性 。 

16.2 你 在 分 析 一 个 拥有 500 个 观测 值 和 一 个 回归 因子 的 线性 回归 模型 。 请 解释 你 将 
如 何 构造 8, 的 置信 区 间 ,如 果 : 

a 重要 报 念 16. 1 中 的 很 设 1 ~4 成 立 , 但 你 认为 假设 5 和 假设 6 可 能 是 不 成 立 的 。 

b， 重 要 概念 16. 1 中 的 假设 1 ~5 成 立 , 而 你 认为 恨 设 6 可 能 不 成 立 ( 给 出 构造 置信 区 
闻 的 两 种 方式 ) 。 

c. 假设 1~6 都 成 立 。 

16.3 ”假定 重要 概念 16. 1 中 的 假设 1~5 都 成 立 , 但 息 设 6 不 成 立 。 表 达 式 (16. 31) 中 
的 结果 会 成 立 吗 ? 请 解释 说 明 。 

16.4 ”如 果 公 式 (16. 41) 成 立 , 但 不 知道 2, 你 能 计算 出 8 的 BLUE 估计 量 吗 ? WISE R 
已 知 ,你 又 怎样 计算 呢 ? 

16.5 构造 一 个 回归 模型 的 合子 , 它 满足 假设 ECu1X.) =0, 但 EUX) #0,。 


"16.1 考虑 公式 (6.1) 中 考试 成 绩 对 收入 和 收入 平方 的 总 体 回 归 。 

a 将 公式 (6. 1) 中 的 回归 写成 公式 (16.4) 中 的 矩阵 形式 ,定义 了 ,X,U 和 如。 

pb， 解 释 如 何在 考试 成 绩 与 收 人 之 间 的 关系 是 二 次 的 备 择 假设 下 检验 考试 成 绩 与 收入 
的 关系 是 线性 的 零 假 设 。 用 公式 (16. 20) 的 形式 写 出 零 仍 设 。 灵 ,r 和 4 分别 是 什么 ? 

16.2 设 有 一 个 n=20 的 居民 户 样本 ,一 个 因 变 量 和 两 个 回归 因子 的 样本 均值 和 样本 























协 方差 数 据 见 表 16 一 !。 
#16! 样本 均值 和 样本 协 方 问 数 据 厅 
样本 均值 样本 协 方 差 
| Y x, x, 
Y | 6.39 0.26 0.22 0.32 
X, 7.24 0. 80 0.28 
X, 4. 00 2. 40 


a. HFE AB ü B, 的 OLS 佑 计 值 ,计算 兰 以 及 回归 的 严 。 


b. 假设 重要 概念 16. 1 中 的 所 有 六 个 假设 者 成立, 在 5% 的 显著 性 水 平 下 检验 假设 
B =0。 

16.3 殷 设 剑 是 协 方 差 短 阵 为 B4 的 mx1l 向 量 ,其 中 ,Zw 是 有 限 的 且 是 正定 的 。 假 
设 c 是 一 个 非 随机 的 m x1 向 世 , 并 且 设 0=e'W。 

a 证 明 :var(0) =e'Bwe。 

b. iz c= ,证 明 0 <var( Q) <, 

16.4 考虑 第 4 章 的 回归 模型 :Y=B6 tX, + ,并 假设 重要 概念 4.3 中 的 所 有 假设 
都 成 立 。 
a. 以 表达 式 (16. 2) 和 表达 式 (16.4) 中 给 出 的 矩阵 形式 表示 这 个 模型 。 

b. 证 明 : 重 要 概念 16. 1 中 的 假设 1 ~4 都 成 立 。 

e. 使 用 公式 (16. 11) 中 所 的 一 般 公式 推导 重要 概念 4.2 中 给 出 的 饥 MA 的 表达 式 。 

d. 诈 明 :表达 式 (16. 13) 中 的 器 的 (1,1) 元 峙 等 于 重要 概念 4.4 中 给 出 的 o 的 表 
达 式 。 

16.5 EP, ñ M, 如 公式 (16.24) 和 公式 (16.25) 所 干 的 定义 。 

a. 证 明 ;PyMy =O, xn B Px 31 M, RE E), 

b FARG 27) 和 和 公式 (16. 28)。 

“16.6 考虑 下 列 征 阵 形 式 的 轩 归 模型 :7 了 = XB + Wy + 其 中 ,处 为 回归 因子 的 nx 有 
BER, W 是 回归 因子 的 一 个 nx MER, BA OLS HEA 可 表示 为 : 

B= (X'M,X) (KM,T) (16.45) 
RERA 是 利用 OLS 通过 估计 公式 (8. 11) 计 算出 来 的 “二 元 变 基 " ElsE 3k TEB H 
Br 是 利用 OLS 通过 估计 公式 (8. 14) 计 算出 来 的 "没有 意义 的 "(de-meaning) 固定 效应 估计 
量 , 其 中 ,特定 实体 的 样本 均值 已 经 从 各 自 的 夺 和 了 中 减 去 了 。 利 用 公式 (16. 45) 证 明 : 记 7 
=Be*。( 提 示 ; 利 用 一 个 固定 效应 的 满 集 , 妈 D1, ,2,,…,Dn, 且 不 包括 常数 项 ,重新 写 出 公 


式 (8. 11), ÆW ht rry sea. SH EBE M X) 
16.7 BEBER: Y. =8.X, + B,W, + ,这 里 为 简单 起 见 , 省 咯 了 截 距 , 且 假定 所 有 


BESLER EE. DX 分 布 独立 于 ( 开 u) IHJ W. 和 六 可 能 是 相关 的 ,并 且 设 遍 和 
ñ, 为 该 模型 的 OLS 估计 起 ,证 明 ， 

a 无 论 W, flu, 是 否 相关 ,都 有 启 一 Bi。 

b. 如 果 W, 和 相关 ,应 是 不 一 致 的 。 

co 设 记 是 了 对 天 回归 中 (排除 了 多 的 那个 有 约束 的 回归 ) 的 OLS 恬 计 量 ,给 出 已 R. 
# É 更 小 的 渐 近 方差 的 条 件 ,允许 W. fü u, 是 相关 的 。 

16.8 考虑 回归 模型 了 =8, +B X. +u HP =u BAFTi=2,3,0 n.u =0. 5u, 
+ú. Phu 是 独立 周 分 布 的 , 旦 均值 为 零 ,方差 为 1, 对 于 所 有 的 i 和 六 之 5 X 是 独立 分 
布 的 。 

"a 推导 EUU) = 三 的 表达 式 。 

b. 请 解释 在 没有 明确 地 对 和 矩阵 和 进行 转 置 的 情况 下 ,如 何 利用 GIS 估计 该 模型 。( 提 
示 : 变 换 该 模型 ,使 得 回归 误差 为 如 ,而 ,…, 忆 ,)】 

16.9 ”这 个 练习 说 明 ; 在 条 件 均值 独立 性 的 假定 { 见 附录 11.3) 条 件 下 ,回归 系数 的 一 








不 子 集 的 OLS 佑 计 蔡 是 一 致 的 ， 考虑 盾 阵 形式 的 多 元 回归 模型 :Y= 好 + Wy +u rh X 
和 家 分 别 为 回归 因 地 的 mx 天 和 nx MER, TX AW RRA MWER: TOLAR 
(16.3)), E(D EIX, W) = WW. 二, 其 中 ,6 是 未 知 参数 的 一 个 x1 E; Gi) (X, 
W., YO EIRY EATA; GD ( 半 , 低 ,,u) 具 有 有 限 的 非 零 的 四 阶 矩 ; (iv) 不 存在 完全 多 重 
共 线 性 。 这 就 是 重要 概念 16. 1 中 的 假设 1 ~4, 只 是 用 条 件 均值 独立 假设 代替 了 通常 的 条 
件 零 均值 假设 。 

a PRAEG ASRR -B=(n XMyX) '(n 'X'M,U) , 

b. 证 明 in X'M eX Xy - Xaver ;其 中 ,Err =E(X.X') ;Ey =FE( XW.) ( 如 
果 对 于 所 有 的 Mj A A HEF, A, AA DAER A, 和 有 4 的 (让 元 素 ,那么 4 
aA), 

c EA :假设 条 件 (说 和 (ii) 隐 含 着 ECUIX,W) = W8. 

d. 利用 (ec) 和 囚 期 望 法 则 ,证 明 :n XM, U 一 一 04 x1。 


e 利用 (a) = (d) 证 明 :在 满足 (i) ~ (iv) 的 条 件 下 后- 一- 四。 





[附录 16.1_ 和 矩阵 代数 简介 ] 


本 附录 概述 了 第 16 章 中 所 用 到 的 向 量 , 矩 阵 以 及 矩阵 代数 的 其 他 一 些 基 本 内 容 。 本 附 
录 的 县 的 是 复习 线性 代数 这 门 课程 中 的 一 些 基 本 概念 和 定义 ,而 不 是 完全 复述 这 门 课程 。 


向 量 与 年 阵 的 定义 
(vector) 是 由 n 个 数 或 元 素 组 成 的 一 个 汇集 , 以 列 的 方式 汇集 称 为 列 向 量 
{ column vector) , 以 行 的 方式 汇集 称 为 行 向量 (row vector), n 维 列 向 量 5 和 维 行 向 量 e 
记 为 : 
b, 


b 
; ‘c={e, ca 和 er] 


b= 
b, 


其 中 ,6, 是 5 的 第 一 个 元 素 ,b, 是 上 的 第 i 个 元 素 。 

整 本 书 中 ,我 们 都 是 用 黑体 符号 表示 向量 和 矩阵 。 

矩阵 [matrix) 是 数字 或 元 素 的 汇集 或 非 列 ,各 元 素 以 行 和 列 进行 排列 。 一 个 矩阵 的 阶 
数 是 n xm, 其 中 表示 行 数 ,m 表示 列 数 。n xm MERA 为 : 








ün Gn om 
A= - . 
其 中 ,a, 是 4 的 (i, 门 元 素 , 即 a, 是 出 现在 第 : 行 .第 7 列 的 元 素 。m x m 阶 和 矩阵 由 个 行 向 量 





或 m 个 列 向 量 构成 。 
为 了 将 一 维 数值 与 向 量 或 矩阵 区 别 开 来 ,我 们 称 一 维 数值 为 标量 { scalar) , 


E. (AB)'=B'A', 
`A hi EREE BE 26. EI AB = BA, RH E— ERREN F EHRE 
以 变换 次 序 , 例 如 , 当 生 和 号 都 是 mxa 阶 对 角 阵 时 ,有 AB= BA. 


矩阵 闭 矩阵 方 根 及 其 相关 问题 


EPIS, A 为 方 阵 。 假 设 和 矩阵 4 的 赣 (Inversej4 一 存在 , 它 被 定义 为 满足 & A 
= 了 的 和 矩阵。 实际 上 ,如 果 道 矩阵 4 存在 ,那么 A 被 称 为 可 着 的 finvertible ) 或 非 奇 异 的 
(nonsigular) 。 如 果 4 A B BDP Si BREZ (AB) BUA, 

ERRE, WV OB nxn 方 阵 。 如 果 对 于 任意 非 零 的 nx1 向 量 e, 有 e'Ve > 0, 
则 称 下 是 正定 的 (positive definite) 。 同 样 ,如 果 对 于 任意 非 零 的 nxl 向量 e, 有 eVez0， 
则 称 下 是 半 正 定 的 {positive semidefinite) 。 如 果 V 是 正定 的 ,那么 它 是 可 递 的 。 

线性 独立 。 如 果 不 存在 非 堆 的 标量 上 和 c, ,使 得 ca + ce =0,,1 ,那么 nx! 向量 
和 es 是 线性 独立 的 (linearly jindependent) 。 更 一 般 地 说 ,如 果 不 存在 非 零 标量 c ,cc 
使 得 ca, +e,a, +… toa, =O, ,那么 称 庆 个 向 量 @ a... a, 的 集合 为 线性 独立 的 . 

智和 孟 的 秩 。x 浆 阶 和 矩阵 4 的 秩 (rank) 是 线性 独立 的 列 向 景 的 个 数 ,4 的 秩 记 为 
rank( A). WME A 的 秩 等 于 4 的 列 数 , 则 称 其 为 列 满 秩 的 。 如 果 n xm EREA 是 列 满 秩 的 ， 
别 椒 存在 一 个 非 零 的 mx1 向 量 e, 使 得 4c =0,,,。 如 果 和 及 为 nxn 方 阵 , 且 rank(4) =n, 
么 和 是 非 奇异 的 。 如 果 n xm 3EFEA 是 列 满 秩 的 , 则 4 凡是 非 坷 异 的 。 

ERFAR, V A nxn 阶 对 称 正定 方 阵 。Y 的 平方 根 阵 定义 为 上 xm ER F , ë 
得 满足 F'F= Y。 一 个 正定 矩阵 的 平方 根 总 是 存在 的 ,但 是 它 不 是 惟一 的 。 和 拖 阵 平方 根 具 
有 FY- BF' = 也 的 性 质 。 此 外 ,一 个 正定 矩阵 的 平方 根 是 可 道 的 ,所 以 ,FP' "VF =L. 


[附录 16. 2_ 多 变量 分 布 ] 


本 险 录 汇集 了 关于 随机 变量 向 量 分 布 的 几 个 定义 及 事实 。 我 们 从 定义 二 维 随机 变量 
的 均值 和 协 方差 矩阵 开始 , 接 下 来 给 出 了 多 元 正 态 分 布 ,最 后 归纳 了 关于 联合 正 态 分 布 随机 
变量 的 线性 函数 和 二 次 函数 的 一 些 事实 。 


均值 问 量 和 方差 矩阵 

随机 变量 的 一 个 m x1 向 量 V= (VV Va) ' 的 一 阶 矩 和 二 阶 矩 ,由 它们 的 均值 向 其 和 
协 方 差 阵 来 概括 。 

由 于 是 一 个 向 量 , 因此 它 的 均值 也 是 个 向 其 , 即 它 的 均值 向 量 { mean vector} 是 
ECV) =u e 均值 向 量 的 第 i 个 元 素 是 的 第 i 个 元 素 的 均值 。 

V KHA ÆR (covariance matrix) ,是 由 沿 着 对 角 线 的 方差 var( V.) i1, n A 
Ci 非 对 角 线 上 的 元 素 cov{¥Y.,V) 组 成 的 矩阵 。 写 成 第 隆 形式 , 协 方差 矩阵 X, 为 : 


var( V.) m ewi F, .V ) 





ky =E[(V-ge)(V-gve)] = (16.46) 








co (V V <  var( VF.) 





多 元 正 态 分 布 
如 果 m x 1 向 量 随机 变量 具有 联合 概率 密度 函数 ; 





(v) pl Vp) Eo (V -pr)] (16.47) 


] 

那么 它 服 从 均值 为 向 量 瑚 ，, 协 方差 种 阵 为 王 , KETELS, rh del) E EBE X, 的 
行列 式 。 多 元 正 态 分 布 表 示 为 N ay: dy)o 

关于 多 元 正 态 分 布 的 一 个 重要 的 事实 是 :如 果 两 个 联 人 台 正 态 分 布 的 随机 变量 不 相关 
{或 者 说 ,具有 零 协 方差 矩阵 ) ,那么 它们 是 独立 分 布 的 。 也 就 是 说 , 设 V. 和 V, 为 联合 正 态 
分 布 随机 变量 , 维 数 分 别 为 mi x1 和 mx1, 如 果 cov( V, Va) =E[ (V, -py)(V -#av,)'] 
Zinam ABA V, 和 下 是 独立 的 。 

如 果 { | 是 独立 同 分 布 的 N(0,0?) ,那么 号, =o?1, ,而 且 多 元 正 态 分 布 简化 为 mm 个 单 
变量 的 正 态 密度 的 乘积 。 


正 态 随机 变量 的 线性 组 合 和 二 次 型 的 分 布 


多 元 正 态 随机 变量 的 线性 组 合 仍然 是 正 态 分 布 的 ,多 元 正 态 随 机 变量 的 某 些 二 次 型 具 
有 卡 方 分 布 。 设 是 一 个 m x1 的 随机 变 生 ,服从 分 布 N(pgy,2y) , 设 志 和 吾 分 别 为 韭 随机 
的 axm FE b xm BERE, i d 为 非 随机 的 ax1 向 量 ,那么 ; 





d+AV~N(d + Apy AF,A') (16.48) 
co( AV BV) =AX,B' (16.49) 

如 果 AX B'=- 0... ,那么 4Y 和 BVY 是 独立 分 布 的 (16.50) 
VE; V ~ (16.51) 


关于 二 次 型 的 另 一 个 有 用 的 结果 涉及 条 等 阵 。 如 果 和 卸 阵 C 是 方 阵 , 且 CC = C, W|3E Ë: 
CERS. V E— Tm 维 多 元 正 态 随机 变量 ,其 分 布 为 N(0,oi1,) ,如 果 C 是 对 称 的 
PERH, MA: 

V'CV/ o ~¥ RP ,r =rank( C) (16.52) 


J> 16.3 J `] 1 近 分 - 


本 附录 给 出 了 表达 式 (16. 12) 中 yn( -8) 的 渐 近 正 态 分 布 的 推导 。 这 个 结果 的 一 个 
ELE LR. 
首先 ,考虑 公式 (16. 15) PRHE X'X/n = 一 D XXX”, AEB0 (UI) 833 











L y XX, WTCOEBEG 16. 1 中 的 第 二 个 假设 ,大 ER Fl Asi AT X X, Eh s= |l 


分 布 的 。 根 据 重要 概念 16. 1 中 的 第 三 个 假设 ,XY 的 每 一 个 元 素 都 具有 四 阶 符 , 所 以 ,根据 
Cauchy-Schwarz 不 等 式 ( 更 附录 15.2) XARA LE. H+ XAA CEE B #h sr ja] a 


布 , L Y X X AAIE Nk L Y Y x, E, X.) BR XXn 的 所 有 元 素 都 成 
n = n an 
立 ,所 以 和 第 im E(X X, ) = Oy 
其 次 ,考虑 公式 (16. 15) 中 的 分 子 算 阵 ,DA = [Y V BU V. = Xa, REER 
概念 16. 1 中 的 第 一 个 释 设 和 昧 期 望 法 则 ,BE(Y ) =E[X EGu 1 是) ] =0,,1。 根 据 第 二 个 最 








小 二 好 假设 ,Y, 是 独立 同 分 布 的， 设 c 是 一 个 有 限 的 上 +1 维 向 其 ,根据 Cauchy-Schwarz 不 
等 式 ,EL (eV) ] =E[(e'Xu)'] =sE[(e'X) (u) '] s /E[(e'X E(u) ,根据 第 三 个 
最 小 二 乘 假设 , 它 是 有 限 的 。 对 于 任意 的 向 基 e, 这 个 结果 都 成 立 , 所 以 E( V.V,') = X, 也 是 
有 限 的 ,并 且 我 们 假定 它 是 正定 的 。 因 此 ,重要 概念 16.2 中 的 多 元 中 心 极限 定理 地 用 于 


Il < l 
一 》 V =—X'U B: 
n ie n P 





l wrr È wy 
A U-—N(0,., Sp) (16.53) 





公式 (16. 12) 中 的 结果 是 根据 公式 (16. 15) .表达 式 {16. 53) XXn 的 一 致 性 .第 四 个 最 小 
二 乘 假 设 (确保 了 (X'X) ”的 存在 ) 以 及 Slutsky 定理 得 到 的 。 


-附录 16.4 ”含有 正 态 误差 的 OLS 检验 统计 量 的 - 
精确 分 布 的 推导 


本 附录 给 出 了 表达 式 (16. 35) 中 的 仅 适用 于 同方 差 的 :统计 量 和 表达 式 (16. 37) 中 的 
仅 适用 于 同方 差 的 下 统计 重 ,在 零 假设 下 它们 的 分 布 的 证 明 ,假设 重要 概念 16. 1 中 的 所 有 
六 个 假设 都 成 立 。 
表达 式 (16. 35) 的 证 明 
， 如 果 : (i) Z 服从 标准 正 态 分 布 ,(ii) 到 服从 AA, Gii Z 和 下 是 独立 分 布 的 ,那么 随 


机 变量 ZAW mR A BEA m 的 :分布 ( 见 附录 15. 1) 。 注 意 22 = (s/o?) 允 px, 那么 表 
达 式 (16. 34) 可 重 写成 ， 











CAE (16.54) 

Hh, W= (n-k-1) (4/03) ,并 且 令 Z = (Á -8.)//(Spx),m=n-k-1, WREE 2 
下 ,= ZAV 和 mm。 因此 ,要 证 明 表 达 式 (16.33) 中 的 结果 ,我 们 必须 证 明 对 于 Z, W A m 的 这 
此 定义 ,(i) -~ GD 的 结论 成 立 。 

i 表达 式 (16. 30) 的 含义 是 :在 堆 假 设 下 ,Z = (ñ -B..)/ (Ya 服从 精确 的 标准 正 
态 分 布 ,这 就 证 明了 (i) 。 

š. 根据 表达 式 (16. 31) ,到 服从 如 -+ 分布 ,这 就 证 明了 (il)。 

ii WIE Gi) 成 立 ,必须 证 明 房 和 有 吕 是 独立 分 布 的 。 

根据 公式 (16. 14) 和 公式 (16. 29) , -A = (X'X) 'X'U, B t= (M,U)'IM,U)/(n -k 
-1), Bip WROC X) 'X'U 和 M,U Sh IBA B -B RL as. (X'X) 'X'U 和 MU 
都 是 U 的 线性 组 合 , 它 服从 分 布 N(0,y1,021,) ,以 下 为 条 件 。 但 是 ,因为 MiX(X'X) = 














0 44)( 见 表达 式 (16.26)), 由 此 得 出 (XX) XU A MU 是 独立 分 布 的 ( 见 表达 式 
《16. 50) ) 。 因 此 ,在 重要 概念 16.1 的 所 有 六 个 假设 下 ; 
B 和 是 独立 分 布 的 (16.55) 


这 就 证 明了 (过 ) ,从 而 也 证 明了 表达 式 (16.35) 。 


表达 式 (16. 37) 的 证 明 

Fa n DAAE Wa (Wan) BAE ER, G) W RA AE: Gi) WBRA, 
A; Gü) W, 和 W, 是 独立 分 布 的 { 见 附录 15.1). ATA 广 形 式 表达 , 设 WW = (RÉ -r)' 
[R(X'X) R'e] (RB -7),W, =(n -上 -1)ss/g。 将 这 些 定 义 代 人 公式 (16. 36) ,得 到 
F=(W./2q)/[W,z(a -~-1)]。 因 此 ,根据 FF 分布 的 定义 ,如 果 (1) ~ GD RE, Em = q, 


n = 上 上, 则 户 服从 F... s. 

i 在 等 假设 下 ,有 后 -r=R(B -8B8)。 因 为 在 表达 式 (16. 30) 中 ,各 服从 条 件 正 态 分 布 , 玉 
是 一 个 非 随机 矩阵 .所 以 ,以 革 为 条 件 的 RR(B -PRADE NO, a R(X'X) R'E). B 
此 ,根据 附录 16. 2 中 的 表达 式 (16. 51), (RB -r)'IRO(X'X) 'R'o;] "(RB - r) RM y, 分 
布 ,从 而 证 明了 (i)。 

i (ü) 中 的 要 求 已 由 表达 式 (16. 31) 给 出 。 

ii EPF 8 -p 和 总 是 独立 分 布 的 ( 见 表达 式 (16. 55) ), AT RB -r 和 有 是 独立 分 布 
的 ,这 反 过 来 又 意味 着 所 和 W, 是 独立 分 布 的 ,这 就 证 明了 (这 ) 。 证 毕 。 

附录 16.5 ”多 元 回归 的 高 斯 一 马尔 可 夫 定 理 的 证 阴 - 

本 附录 证 明了 多 元 回归 模型 前 高 斯 一 马尔 可 夫 定 理 ( 见 重要 概念 16. 3) REBR 
一 个 线性 条 件 无 偏 估 计量 ,于 是 6 =A'Y 且 E(B1X) =B, 其 中 ,4 是 一 个 hn x(k+1) 阶 矩阵 ， 
它 依 束 于 了 积 非 随机 常数 ,我 们 证 明 , 对 于 所 有 的 i +1 维 向 量 e ,有 var(e') varle). 
这 里 当 且 仅 当 启 = 有 时 ,不 等 式 中 的 等 式 才 成 立 。 

HT EREN, AE, CIRS AÊ AY =A (XB +U) = (A'X)8+A'U, RER 
个 高 斯 一 马尔 可 去 条 件 ,E(UIX) =b, ,所 以 ,开户 下) = (AXB BE h TERFN 
ERIX) =B =(A'X)B, ZERE AX =L. AÂ =B +A'U, 从 而 var (B1X) = 
var[A"UlX) =E(A'UU'AIX) =A'E(UU'|X)A =o:4'4, 其 中 ,第 三 个 等 式 成 立 是 因为 A 
会 依 束 于 五 但 不 依赖 于 点 ,最 后 一 个 等 式 成 立 是 因为 第 二 个 高 斯 一 马尔 可 夫 条 件 , 即 如 果 启 
是 线性 的 和 无 偏 的 ,那么 在 高 斯 一 马尔 可 夫 条 件 下 ， 

4 下 = 下 var( 记 于) = A'A (16. 56) 
MA =Á = X(X'X) R FAG. 56) 中 的 结果 也 适用 于 让, 这 里 ,根据 第 三 个 高 斯 一 马尔 可 
夫 条 件 , (X'Y) 存在 。 

MEU A -Å + 了 D, 因 此 ,DD 为 权 数 矩 阵 和 A 和 A 之 差 。 注意, 因为 44 = (X'X) 'X'A = 
(XX) -1( 根 据 公式 {16. 56) ) AÂ = (XX) XXX)! = (X'X) ,所 以 ,4'D=A'(4 - 
Å) =A'4 -44 =0unxrerbe 将 4=A4+D 代 人 公式 (16.56) 中 的 条 件 方差 公式 ,得 到 ; 

var(PIX) =P (Á +D} {A +D) 
=a [À A +4'D+ D'À +D'D] 
=o (X'X) +o D'D (16.57) 
其 中 ,最 后 一 个 等 式 利用 了 AÅ = (XX) RÂD 0u . n a p HRK. 
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续 表 














z 的 第 二 个 小 数位 的 值 

z 0 1 2 3 4 5 6 7 8 9 

-0.8 |0.2119 0.2090 0.2061 0.2033 0.2005 0.1977 0.1949 0,1922 0.1894 0.1367 
-0.7 (0.2420 0.2389 0.2358 0.2327 0.2296 0.2266 0.2236 0.2206 0.2177 0.2148 
-0.6 {0.2743 0.2709 0.2676 0.2643 0.2611 0.2578 0.2546 0.2514 0.2483 0.2451 
-0.5 |0.3085 0.3050 0.3015 0.2981 0.2946 0.2912 0.2877 0.2843 0.2810 0.2776 
-0.4 [0.3446 0.3409 0.3372 0.3336 0.3300 0.3264 0.3228 0.3192 0.3156 0.3121 
-0.3 [0.3821 0.3783 0.3745 0.3707 0.3669 0.3632 0.3594 0.3557 0.3520 0.3483 
-0.2 104207 0.4168 0.4129 0.4090 0.4052 0.4013 0.3974 0.3936 0.3897 0.3859 
-0.1 (0.4602 0.4562 0.4522 0.4483 0.4443 0.4404 0.4364 0.4325 0.4286 0.4247 
-0.0 10.5000 0.4960 0.4920 0.4880 0.4840 0.4801 0.4761 0.4721 0.4681 0.464 
0.0 |0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359 
0.1 [0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753 
0.2 10.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0 6103 0 6141 
0.3 |0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517 
0.4 [0.6554 0.659 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879 
0.5 |0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224 
0.6 (0.7257 0.7291 0.7324 0.7357 0,7389 0.7422 0.7454 0.7486 0.7517 0.7549 
0.7 10.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852 
0.8 |0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133 
0.9 108159 08186 0.8212 0.8238 0.8264 0.8289 0.8315 0,8340 0,8365 0.8389 
LO (08413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621 
1.1 10.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830 
1,2 |0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015 
13 [0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9711 
1.4 10.9192 0.9207 0.9222 0.9236 0.925} 0.9265 0.9279 0.9292 0.9306 0.9319 
1.5 |0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.944 
1.6 (0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0,9525 0.9535 0.9545 
1.7 [0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633 
1.8 (0.9641 0.9649 0966 0.9664 0.9671 09678 0.9686 0.9693 0.9699 0.9706 
L9 (09713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767 
20 (0.9772 0.97718 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817 
2,1 |0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857 
22 |0986 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890 
23 |0.9893 0.9896 0.9898 0.9901 0.9904 0.9905 0.9909 0.9911 0.9913 0.9916 
2.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936 
25 |0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952 
26 |09053 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964 
2.7 |0.9965 0.9966 0.9967 0.9968 0,9969 0.9970 0,9971 0.9972 0.9973 0.9974 
28 |0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.998İ 
29 [0.9981 0.9982 0.9982 0,9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986 








注 :该 表 可 以 用 来 计算 Pris), EF Z 是 标准 正 态 分 布 变 量 。 例 如 , 当 z = 1.17 时 ,概率 为 0.8790， 
即 表 中 标记 为 1. 1 的 行 与 标记 为 7 的 列 相交 之 处 的 数值 。 


HR? 双边 和 单 边 检验 的 学 生 ! 分 布 临界 值 











显著 性 水 平 
PLE 20% ( UM) 10% (235) S GR) 2 (AB) La B) 
| OFOP) Ser (Will) 25% (hin) 1% (j) 0 5%( 53) 

l 3. 08 6.31 12.71 31. 82 63. 66 

2 1.89 2.92 4.30 6. 96 9.92 

3 1.64 2.35 3.18 4.54 5.84 

4 1.53 2.13 2.78 3.75 4.60 

5 t. 48 2.02 2,57 3.36 4.03 

6 1.44 1.94 2.45 3.14 3.71 

7 L.41 1.89 2.36 3.00 3. 50 

8 1.40 1.86 2.31 2.90 3 36 

9 1.38 1.83 2.26 2.82 3 25 
10 1.37 1.81 2,23 2.76 3.1? 
11 1.36 1.80 2.20 2.72 3.11 
12 1.36 1.78 2. 18 2, 68 3.05 
13 1.35 1.77 2.16 2.65 3.01 
14 1.35 1.76 2.14 2. 62 2.98 
15 1.34 1.75 2.13 2. 60 2.95 
16 1.34 1.75 2. 12 2.58 2.92 
17 1.33 1.74 2.11 2.57 2.90 
18 1.33 1.73 2.10 2.55 2. 88 
19 L33 1.73 2.09 2.54 2. 86 
20 1.33 1.72 2.09 2 53 2. 85 
21 1.32 1.72 2.08 2 52 2.83 
22 L32 1.72 2.07 2.51 2. 82 
23 1.32 1.71 2.07 2,50 2.81 
24 1.32 1.71 2. 06 2.49 2. 80 
25 1.32 L. ?1 2.06 2.49 2.79 
26 L. 32 1.71 2. 06 2.48 2. 78 
27 1.31 1.70 2. 的 2.47 2.77 
28 1.31 1.70 2.05 2.47 2.76 
29 1.31 1.70 2. 05 2.46 2.76 
30 1.31 1.70 2. %4 2,46 275 
60 1.30 1. 67 2 的 2.39 2. 66 
90 1.29 1.66 1.99 2,37 2.63 
120 1.29 1. 66 1 98 2.36 2.62 
oo 1.28 L64 1 96 2.33 2. 58 











注 : 表 中 所 示 为 备 择 假设 的 双边 { 关 ) 和 单 边 ( > ) 的 临界 值 。 单 边 检验 ( < ) 检验 的 临界 值 为 表 中 所 示 
的 单 边 检验 ( > ) 的 临界 值 的 相反 数 。 例 如 ,2. 13 为 利用 自由 度 为 15 的 学 生 : 分 布 的 双边 检验 的 5 的 显 
著 性 水 平 的 临界 值 。 


附 表 3 卡 方 分 布 的 临界 值 
































显著 性 水 平 
HAE 
19% 5% 1% 
] 2.71 3. 84 6. 63 
2 4.61 5.99 9.21 
3 6. 25 7.81 11 34 
4 7.78 9,49 13. 28 
5 9.24 11.07 15. 09 
6 10.64 12. 59 16.81 
7 12. 02 14.07 18. 48 
8 13. 36 15.51 20. 09 
9 14. 68 16. 92 21. 67 
10 15. 99 18. 31 23.21 
11 17. 28 19. 68 24, 72 
这 18. 55 21. 03 26. 22 
13 19,81 22. 36 27.69 
14 21. 06 23. 68 29, 14 
15 22.31 25. 00 30. 58 
16 23. 54 26. 30 32. 00 
17 24.77 27. 59 33.41 
18 25.99 28. 87 34.81 
19 27. 20 30. 14 36. 19 
20 28.41 31.43 37.57 
21 29, 62 32, 67 38.93 
22 30.81 33. 92 40, 29 
23 32.01 35.17 41. 64 
24 33. 20 36.41 42. 98 
25 34. 38 37. 65 44.31 
26 35, 56 38. 89 ' 45.54 
27 36. 74 40.11 46. 96 
28 37.92 41.34 48. 28 
29 39. 09 42. 56 49. 59 
30 40. 26 43. 77 50. 89 





a 
注 ; 该 表 给 出 了 卡 方 分 布 的 第 0 .第 95 和 第 99 个 百 分 位 数 。 它 们 可 作为 在 10% ,5% 和 1 名 的 显著 性 
水 平 下 检验 的 临界 值 。 


MEI 尺 -分布 的 临界 值 





面积 = 显 兰 性 水 毕 





















nB] 10% 5% 1% 
1 2.71 3.84 6.63 
2 2.30 3. 00 4.61 
3 2.08 2. 60 3. 78 
4 1.94 2.37 3. 32 
5 1.85 2.21 3. 02 
6 1.77 2.10 2. 80 
7 1.72 2.01 2. 64 
8 1.67 1.94 2.51 
9 1. 63 L. 88 2.41 

10 1. 0 1.83 2.32 
11 1.57 1.79 2.25 
12 L.55 1.75 Z. 18 
13 1. 52 1.72 2.13 
14 1. 50 1.69 2. 08 
15 1,49 1.67 2. 04 
16 1.47 1.64 2. 00 
17 L. 46 1.62 1.97 
18 1.44 1. 的 1.93 
19 1.43 1.59 1.90 
20 1.42 L. 57 1.88 
21 1,41 1.56 L. 85 
22 1.40 1. 54 1.83 
23 1.39 1. 53 1.81 
24 1.38 1.52 1.79 
25 1.38 L.51 1.77 
26 1.37 1.50 i.76 
2? 1.36 1.49 1.74 
28 1.35 1.48 1.72 
29 1.35 1.47 1.71 
30 1.34 1. 46 1. 70 








E RRB T Fua 分布 的 第 加、 第 %5 和 第 99 个 百 分 位 数 。 它 们 可 和 作为 在 10% ,5% 8 1% REEE 
水 平 下 检验 的 临界 值 。 





HRSA 天， 分 布 的 临界 值 一 一 10 色 的 显著 性 水 平 








JEEN HUS! 分 子 自 由 度 {mi 1 
Ga) | Í 2 3 4 5 6 7 8 9 i0 

1 3986 49.50 S5359 55.83 5724 58.20 58.90 59.44 59,86 60.20 
2 185. 90 916 924 92 933 935 937 938 939 
3 55 546 53 534 Sl 528 527 52 SM SB 
4 1 454 435 4 4 40 dO 398 395 394 392 
5 j 406 37 362 352 345 340 337 334 332 330 
6 | 378 346 32 38 lH 305 30 298 2% 294 
7 | 3 326 30 29 28 28 27 27 22 27 
8 | a4 3 291 28 272 26 262 259 2356 254 
9 | 336 30 28 269 26l 255 25 24 24 24 
10 3, 29 2,92 2.73 2.61 2. 52 2. 46 2 41 2, 38 2. 35 z 32 
t 32 286 266 23 245 23 234 23 22 225 
2 l 348 28 26 248 23 23 223 24 22 219 
3 | 314 27 256 243 235 22 22 22 216 214 
14 | 310 223 25 23 23 224 2J9 245 212 210 
I5 | 307 23 24 236 LI LA 246 21 20 20 
6 | 305 267 24 233 224 218 213 20 20 20 
2 | 303 264 244 23 222 21 20 20 20 20 
8 | 30 262 242 229 22 213 20 20 20 L98 
| 299 26 240) 22 248 21 206 202 198 1.96 
20 Í 297 259 238 225 216 20 20 20 1.9% L% 
2 | 296 25 236 22 24 208 202 L9 19 19 
22 1 295 256 235 22 243 20 20 L9 LB 19 
233 | 294 255 234 223 2 20 1.99 195 1,9% 1.89 
24 | 293 254 23 219 210 20 L98 19 19 L8 
235 | 292 25 23 218 20 20 L97 L93 199 1 
26 | 291 25 23 2 208 20 196 1928 188 L8 
22 | 290 25 23 27 20 20 195 191 187 185 
28 | 289 250 229 216 20 20 19M 190 L8 184 
32 | 289 250 22 215 20 19 L9% 189 186 1.83 
3 | 28 249 228 214 20 L98 195 L88 185 1.82 
60 | 279 239 218 20 19% LR LR L7 L4 LA 
g0 | 2720 236 215 20 19 L84 LI 14 LW 1.67 
Da | 225 235 243 199 19 L82 177 172 L68 L65 








注 :该 表 给 出 了 ,分 布 的 第 90 个 让 分 位 数 。 它 可 作为 在 10% E Ek E FS 39 RE 9248 - 


附 表 5B ,分 布 的 临界 值 一 -5 名 的 显著 性 水 平 














SEAIS 分 于 自由 度 {n,1】 
(n.) | 2 3 4 5 6 7 8 9 10 

1 i61.40 199.50 215.70 224.60 230.20 234.00 236.80 238.90 240.50 241.%0 
2 18.5} 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.39 19.40 
3 10. 13 9 55 9. 28 5.12 9.01 8.94 8. 89 8. 85 8.81 8. 79 
4 771 694 659 639 626 616 60 60 60 5.96 
5 661 579 54 519 350 49 488 482 4 和 414 
6 399 514 476 453 439 428 42 415 410 4.06 
7 5.59 474 435 412 397 38 37 37 36 3.64 
8 532 446 407 3.84 3 的 338 3 和 34 339 3.35 
9 5,12 426 396 363 348 337 32 32 3 ZLM 
10 49% 410 37 348 333 322 344 300 300 2,98 
ll 48 398 3539 336 3.20 309 30 29 29 285 
12 475 389 349 326 311 300 29 28 28 2.75 
13 46 381 44 318 303 29 28 277 27 2.67 
14 4 的 374 33 31I 29% 28 276 27 265 260 
15 454 36 32 30 29 22 21 26 25 254 
16 449 36 3234 30 28 274 26 25 254 2.49 
17 445 359 3.20 29 28 21 ?261 255 249 2.45 
18 4.41 355 3.16 293 277 26 258 251 24 2# 
19 438 3.52 3.13 290 2⁄4 263 254 248 24 2.38 
20 435 349 3.10 287 271 26 25 24 239 2.35 
21 432 347 307 28 26 25 249 2⁄4 23 2.32 
22 4.30 344 30 28 266 25 246 24 234 2.30 
23 4238 342 30 289 26 253 244 23 232 2.27 
24 426 340 30 278 262 25 24 2% 23 2.25 
25 424 339 299 276 26 249 24 23 22 224 
26 423 337 2% LM 259 247 23 23 22 2.2 
27 421 335 296 273 25 246 23 23 225 2.20 
28 420 334 29 271 256 245 235 229 224 2.19 
29 A18 333 293 270 25 24 23 223 222 2.18 
30 4.17 33 29 26 253 242 23 27 23 2.16 
60 4.00 3.15 2.76 2.53 2.37 2.25 2.17 2.10 2.64 1.99 
90 395 310 2721 247 232 220 2 20 1% 194 
120 3.92 3m 268 245 22 218 20 20 1% 1.91 








注 :该 表 给 出 了 F, DARAS TANER CETERE 5% BJ 8 35 qkoy F 932916 n da 


i "2 





MRSC FF, 分 布 的 临界 值 一 1% 的 显著 性 水 平 























sri Ua 分 子 自由 度 {n】 

(na) I 2 本 3 4 5 6 7 8 9 14 
1 |4 052 00 4 999. 00 5 403. 00 5 624. 00 5 763. 00 5 859. 00 5 928. 00 5 981. 00 6 022. 00 6 055. 00 
2 98.50 99.09 99.17 99.25 00.30 99.33 99.36 99.37 99.39 99,40 
3 34.12 30.82 29.46 28,7 28.24 27.91 27.67 27,49 27.35 27.23 
4 21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.80 14.66 14.55 
5 16.26 13.27 12.06 E39 1097 10.67 10.46 10.29 10.16 10.05 
6 13.75 10.92 978 915 875 847 826 80 798 787 
7 12.25 9.55 845 7.85 7.46 7.19 69 68 67 66 
8 11.26 865 759 70 66 637 618 60 59 58l 
9 10.56 802 699 642 60 580 56 547 535 5.26 
10 10.04 7.56 655 3599 564 539 52 50 494 485 
11 965 72A 62 567 532 507 489 474 463 454 
12 933 693 595 54 5.06 482 46 450 439 430 
13 907 670 574 521 486 462 4 和 430 419 410 
14 8.86 65l 5.56 503 469 43446 4B 414 40 3% 
15 868 636 542 489 456 432 44 400 38 38 
16 B53 623 529 47 44 420 403 38 378 369 
17 840 611 518 467 434 410 393 379 368 3.59 
, 18 8.29 6.01 50 458 425 401 384 371 360 3.51 
19 88 59 So 450 414 39 37 36 352 3.4 
20 810 585 394 443 410 38 30 356 346 3.37 
21 802 578 487 437 404 38E 364 3.51 340 3.31 
22 7.95 572 482 43 3 的 376 359 345 335 3% 
23 7.88 566 476 426 394 37 354 341 330 321 
24 782 561 472 422 390 367 3.50 336 32 30 
25 7.77 5.57 468 418 385 363 346 332 322 4AB 
26 772 5.53 46 414 382 359 342 329 318 3 的 
27 768 549 4 的 41l 3798 356 339 326 315 3.06 
28 764 5.45 457 40m 375 353 336 32 312 30 
29 760 542 454 404 3.3 350 33 32 30 30 
30 7.56 539 451 40 370 347 330 317 30 2.98 
60 708 498 413 365 334 312 295 28 272 2.63 
90 693 485 40 35 32 30 28 272 26 25 
120 685 47 395 348 3.17 296 2799 266 256 2.4 


广 :该 表 给 出 了 ,分 布 的 第 多 个 百 分 位 数 。 它 可 作为 在 1 够 的 显著 性 水 平 下 检验 的 临界 值 ， 





第 2 章 


2.1 这 些 结果 是 随机 的 ,因为 在 它们 实际 发 生 之 前 ,是 巨 法 确切 地 知道 它们 的 。 体 无 
法 确切 地 知道 你 将 要 遇 到 的 下 一 个 人 的 性 别 ,通勤 到 学 校花 费 的 时 间 等 等 。 

2.2 如 果 半 和 了 是 独立 的 ,那么 对 于 所 有 的 7 Fla IË. A Pr(Y=y|X=x) =Pr(VY=), 
也 就 是 说 ,独立 性 意味 状 了 的 条 件 分 布 和 边缘 分 布 是 相同 的 ,所 以 ,知道 下 的 值 不 会 改变 了 
的 概率 分 布 ,知道 的 值 对 了 职 不 同 值 的 概率 没有 任何 意义 。 

2.3 ”尽管 降雨 量 和 婴儿 出 生 数 之 间 没 有 明显 的 因 累 联系 ,但 降雨 量 也 能 够 告诉 你 一 些 
关于 婴儿 出 生 数 的 事情 。 知 道 降 十 芥 可 以 知道 是 什么 季节 ,而 出 生 是 季节 人 性 的 。 因 此 ,知道 
降雨 大会 告诉 你 关于 月 份 的 一 些 信 息 ,这 对 会 告诉 你 关于 婴儿 出 生 数 的 一 些 信 息 ， 所 以 , 降 
十 好 和 婴儿 出生 数 不 是 独立 分 布 的 。 

2.4 4 个 随机 选择 的 学 生 的 平均 体重 不 可 能 精确 她 等 于 145 g. 4 个 学 生 的 不 同 的 组 
会 有 不 同 的 样本 平均 体重 ,有 的 大 于 145 磅 ,而 有 的 小 于 145 磅 ,因为 这 4 个 学 生 是 随机 选 
择 的 ,他 们 的 样本 平均 体重 也 是 随机 的 。 

2.5 所 有 这 些 分 布 都 具有 正 态 的 形状 ,上 且 以 了 的 均值 1 为 中 心 , 但 它们 会 有 不 同 的 
“离散 度 ” ,因为 它们 有 不 同 的 方差 。 了 的 方差 是 4/4, 所 以 随 着 ”的 增加 ,方差 减 小 。 在 图 
形 中 ,n=2 时 正 态 分 布 的 离散 度 要 比 n=10 时 宽 , 而 n=10 时 的 高 散 度 应 该 比 n=100 时 
Fo Hn 变 得 非常 天 时 ,方差 接近 于 0, 正 态 分 布 退缩 到 了 的 均值 周围 , 即 随 着 = 的 增 大 ,Y 
的 分 布 商 度 集 中 在 Ar 周围 (了 逼近 my 的 概率 趋向 于 1) ,这 正 是 大 数 定律 所 表明 的 。 

2.6 当 ==5 时 , 正 态 逼 近 的 效果 看 上 去 不 是 很 好 ,但 当 a =25 和 n=100 时 , 正 态 通 近 
的 效果 着 上 去 就 会 很 好 。 因 此 , 当 n=25 sË n = 100 J ,Pr( Y<0. 日 大 约 等 于 由 正 态 逼近 所 
计算 的 值 ,但 当 n =5 时 却 不 能 很 好 地 被 正 态 分 布 的 值 所 近似 。 
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3.1 总 体 均 秆 是 总 体 中 的 平均 数 。 样 本 平 艾 数 了 是 从 总 体 中 抽取 的 一 个 样本 的 平 
均 数 ， 

3.2 和 估计 量 是 计算 总 体 参 数值 的 一 个 理 性 猜测 的 方法 ,如 总 体 均 值 。 估 计 值 是 佑 计量 
在 一 个 给 定 的 样本 中 所 生成 的 数值 。 了 就 是 估计 量 的 一 个 例子 , 它 给 出 了 计算 总 体 均 值 的 
一 个 理性 猜测 的 一 种 方法 (将 样本 中 所 有 的 了 值 相 加 然后 除 以 4)。 如 果 一 个 =4 的 样本 
生成 的 样本 了 的 值 为 100 ,104,123 和 96, 那 么 用 千 计 量 了 计算 的 估计 值 是 105. 75。 

3.3 在 所 有 的 情况 下 了 的 均值 都 是 10。 了 的 方差 是 var( 了 )/n, 当 n=10 时 ,var( 了 ) = 
1.6;`4 n =100 时 ,var( F) =0.16; 当 n=1 000 时 ,var( 了 ) =0.016。 因 为 随 着 的 增加 ， 
var( 了 ) 收 合 于 0, 所 以 随 着 n 的 增加 ,了 逼近 于 10 的 概率 接近 于 1。 这 是 大 数 定律 所 表 
明 的 。 

3.4” 当 用 样本 均值 检验 假设 时 ,中 心 极限 定理 起 着 重要 的 作用 。 因 为 当 样本 容量 很 大 
时 ,样本 均值 近似 为 正 态 分 布 ,所 以 ,假设 检验 的 临界 值 和 检验 统计 量 的 P 值 可 以 利用 正 态 
分 布 来 计算 。 正 态 临 界 值 还 被 用 于 构造 置信 区 间 。 

3.5 这 部 分 内 容 在 3.2 节 中 做 了 描述 。 

3.6 ” 复 信 区 间 包 含 了 当 被 用 懒 零 假设 时 不 能 被 拒绝 的 参数 的 所 有 值 (如 均值 )， 
此 , 它 概括 了 从 一 个 数量 非常 大 的 假设 检验 中 所 得 的 结果 。 

3.7 图 (a) 是 向 上 倾斜 的 ,而 及 点 恰好 在 直线 上 。 图 (b}) 是 向 下 倾斜 的 ,而 且 点 恰好 在 


直线 上 。 图 (o) 应 该 显示 出 正 向 关系 ,而 且 点 应 该 接近 于 但 不 是 完全 恰好 在 向 土 倾斜 的 直 
线 上 。 图 (9) 显示 出 灾 基 之 间 的 一 般 的 负 向 关系 ,而 且 点 散布 在 向 下 倾斜 的 间 线 周围 。 图 
(e) 在 变量 之 问 没 有 明显 的 线性 关系 。 
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4.1 p 是 总 体 回归 中 斜率 的 值 , 它 是 未 知 的 。 PB,( 估 计量 ) 纵 出 了 从 一 个 样本 中 合计 
未 知 值 的 B, RRR, PE, u, 是 第 i 个 观测 值 的 回归 误差 值 ;u, 是 了 ,与 总 体 回 归 线 8, + 
BX, Z% AA p 308, 的 值 都 是 未 知 的 ,所 以 的 值 也 是 未 知 的 。 相 反 , 训 是 了 与 记 + 
ÊX, ZA Am, o, E u 的 一 个 估计 革 。 最 后 ,BE(YIX) =B + 及 下 是 未 知 的 ,因为 记 和 用 
是 未 知 的 ;对 它 的 一 个 居 计 量 是 普通 最 小 二 乘 预 测 值 成 +。 

4.2 Hy #=0 的 六 边 检验 的 p 值 ,可 以 使 用 ,i =1,…,n 的 独 空间 分 布 观测 值 的 集 
人 台 分 三 步 来 构造 ;(1) 计算 样本 均值 和 标准 误 SE(Y) ;(2) 计算 这 个 样本 的 :统计 量 r” = 
Y"'7SE(Y) ;(3) 利 用 标准 正 态 分 布 表 计算 p 值 =Pr(12Z1 >l) =28(- 12*1)。 可 以 用 类 
似 的 三 步 程序 来 构造 双边 检验 H p, =0 的 P 值 :(1) 计 算 回 归 斜 率 的 OLS 估计 值 和 标准 
误 5E(B);(2) 计 算 这 个 样本 的 :统计 量 1*™ = 记 ' /LSE(B ) ;(3) 利 用 标准 正 态 分 布 表 计算 p 
{É =Pr( |Z] >11) =2ġ(- li), 

4.3 1992 年 的 工资 性 别 差异 可 以 用 公式 (4. 41) 中 的 国 归 和 表 3 一 1 中 1992 年 的 行 所 
总 结 的 数据 来 估计 。 因 变量 是 样本 中 第 个 人 的 每 小 时 收入 。 解 释 变 量 是 一 个 二 元 变量 ， 
如 果 是 男性 , 它 等 于 1; 如 果 是 友 性 , 它 等 于 0。 总 体 中 的 工资 性 别 差异 是 回归 中 的 总 体系 数 
B,, 它 可 以 用 局 来 估计 。 其 他 年 份 的 工资 性 别 差 异 可 以 用 类 似 的 方式 估计 。 

4.4 F 值 表明 了 点 在 所 估计 的 回归 直线 周围 的 分 散 程 庆 。 当 屯 =0.9 时 ,点 应 该 散 
布 在 非常 接近 回归 直线 的 地 方 。 当 刁 =0.5 时 ,点 在 直线 周围 应 该 是 更 分 散 的 。 刁 并 不 表 
明 直 线 的 斜率 是 正 的 还 是 负 的 。 
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5.1 由 于 存在 遗漏 变量 ,因此 启 可 能 是 有 偏 的 。 富 裕 学 区 的 学 校 可 能 在 所 有 的 教育 
投入 上 楷 费 更 多 , 进 凋 会 有 更 小 的 班级 规模 ,在 图 书馆 有 更 多 的 书 和 更 多 的 计算机 。 这 些 其 
他 投入 可 能 会 导致 更 高 的 平均 考试 成 绩 。 因 此 , 记 是 向 上 偏 的 ,因为 每 位 学 生 的 计算 机 数 
与 对 平均 考试 成 绩 有 正 效 应 的 遗漏 变量 正 相关 。 

5.2 WE X, 增加 3 个 单位 而 和 不 变 , 那 么 预期 了 的 变化 为 35, 个 单位 。 如 果 X, M 
少 5 个 单位 而 不 变 , 那 么 预期 了 的 变化 为 - 5; 个 单位 。 如 果 增加 3 个 单位 而 和 W 
少 5 个 单位 ,那么 预期 了 的 变化 为 35, -58, 个 单位 。 

5.3 该 回归 不 能 确定 回归 因子 中 一 个 回归 因子 变化 (假设 其 他 回归 因子 不 变 ) 的 效 
庶 , 因 为 如 果 一 个 完全 多 重 共 线 的 回归 因子 的 值 保 持 不 变 , 那 么 其 他 回归 因子 的 值 地 不 变 ， 
即 在 一 个 多 重 基线 的 回归 因子 中 不 存在 独立 的 变化 。 完 全 多 重 共 线 的 回归 因 于 的 两 个 例子 
是 ;(1) 用 磅 测量 的 某 大 的 体重 和 用 千克 测量 的 同一 个 人 的 体重 ;(2) 当 数 据 取 自 于 所 有 男 
生 学 校 时 ,学 生 中 男生 的 比重 和 常数 项 。 

5.4 有 =0 的 零 假设 可 以 用 重要 概念 5.4 中 所 介绍 的 Bi 的 :统计 量 进 行 检验 。 同 样 ， 
B. =0 的 零 假设 可 以 用 B, 的 :统计 量 进 行 检验 。B, =0 #I B, =0 的 零 假设 可 以 用 5.7 节 中 





的 到 统计 量 进 行 检验 。 严 统计 基 对 检验 一 个 联合 假设 是 必需 的 ,因为 该 检验 将 以 启 和 应 
为 基础 ,这 意味 着 该 检验 的 程序 必须 使 用 它们 的 联合 分 布 的 性 质 。 

5.5 这 里 有 一 个 例子 。 利 用 几 年 的 经 济 计量 学 授课 考试 的 数据 ,一 们 教授 用 学 生 的 期 
未 考试 分 数 ( 妇 对 他 (她 ) 们 的 期 中 考试 分 数 (X) 进行 回归 。 这 个 回归 将 会 有 高 的 严 ,因为 
期 中 考试 成 绩 好 的 人 倾向 子 在 期 末 考 试 中 也 取得 好 成 绩 。 然 而 ,这 个 回归 产生 了 期 中 考 泛 
分 数 对 期 末 考 试 分 数 因果 效应 的 一 个 有 偏 估 计 。 期 中 成 绩 好 的 学 生 倾 向 于 是 那些 上 课 有 规 
律 .学 习 努 力 而 且 对 这 个 科目 有 热情 的 学 生 。 这 些 变量 与 期 中 考试 分 数 相关 ,但 又 是 期 末 考 
HITRA EAR, 因此 漏 掉 它 们 会 导致 遗 尘 变 量 仙 差 。 
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6.1 KARRA LARR 6-3 中 的 二 次 回归 或 图 6 一 4 中 的 对 数 函 数 。 前 者 设 
EA YXA X° 的 回归 ,后 者 设 定 为 Y 对 In(X}) 的 回归 。 有 许多 经 济 关系 类 似 于 这 种 形 
状 。 例 如 , 这 个 形状 可 能 代表 生产 函数 中 递减 的 边际 劳动 生产 率 。 

6.2 ”对 方程 的 两 边 取 对 数 得 :Int@) = +B.ln (K) + 房 有 (六 +B,In( M) +u, EP 8, 
=ln(A)。 该 生产 函数 的 参数 可 以 通过 用 产量 的 对 数 对 资本 .劳动 和 原材料 的 对 数 进 行 回 
归来 估计 。 

6.3 GDP 增加 2% 意 昧 着 In( CDP) 0.02. (m) Ë S JE 4k E 1.0 x0.02 = 
0.02, 它 对 应 于 m HI., HT R HE O2PAMIBK IE. R 从 4.0 增加 到 5.0, 或 者 说 增加 
1.0 个 百分点 。 这 导致 In(m) 的 变化 为 -0.02 x1.0 = -0.02 , EX M F m F2% 。 

6.4 ”你 想 要 比较 你 所 做 的 线性 回归 的 拟 合 程度 与 非 线 性 回归 静 拟 合 程度 。 答 案 将 取 
决 于 你 所 选择 的 用 来 比较 的 非 线 性 回归 。 你 可 以 检验 线性 回归 ,对 应 子 癌 线性 回归 中 添 加 
r 得 到 的 一 个 二 次 回归 。 如 果 站 的 系数 显著 地 不 同 于 0, 那 么 就 可 以 拒绝 这 个 关系 是 线性 
的 零 假 设 ,接受 它 是 二 次 的 备 择 假设 。 

6.5 在 问题 6.2 的 方程 中 增加 一 个 交叉 项 得 到 ;In(0) =g +B.In( K) +B,ln ( L) + 
B,n(M) +B,[In (K) x]n(L)] +u, In(L) 对 Int0) 的 局 部 效应 现在 是 B, + Bhin(K)。 
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71 见 重要 概念 7. 1 和 紧 接 在 重要 概念 方 要 之 后 的 段落 。 

7.2 包 合 一 个 本 来 属于 回归 的 额外 变量 将 会 消除 或 威 少 遗 漏 变量 偏差 。 但 是 一 般 而 
言 ,包含 -- 个 不 属于 回归 的 额外 变量 将 会 降低 其 他 系数 估计 量 的 精度 (增加 方差 )。 

7.3 区别 了 中 的 测量 误差 或 X 中 的 测量 误差 是 非常 重要 的 。 如 果 了 的 测量 中 有 错 
误 , 那 么 这 个 测量 误差 会 成 为 回归 误差 项 u 的 一 部 分 。 如 果 重 要 概念 5. 4 中 的 假设 仍然 成 
立 ,那么 这 不 会 影响 普通 最 小 二 乘 回 归 的 内 部 有 效 人 性 ,尽管 使 问 归 误 差 项 的 方差 变 大 了 ,但 
它 增加 了 普通 最 小 二 有 滋 估 计量 的 方差 。 可 是 ,如 果 X 的 测量 中 有 错误 ,那么 这 可 能 会 导致 
该 回归 因子 和 回归 误差 项 之 间 的 相关 ,从 而 导致 普通 最 小 二 乘 估 计量 的 不 一 致 性 。 如 公式 
(7.2) 所 表明 的 , 随 着 这 个 不 一 致 性 变 得 越 严重 , 这 个 测量 误差 就 越 大 ( 即 公式 (7.2) 中 的 
o, K). 

7.4 学 生成 绩 较 高 的 学 校 更 可 能 会 自愿 参加 这 项 考试 ,因此 , 自愿 参加 此 项 考试 的 学 
校 不 能 代表 学 校 的 总 体 ,并 会 导致 样本 选择 偏差 。 例 如 ,如 果 所 有 低 学 生 一 教师 比 的 学 校 参 
加 了 这 个 考试 ,但 在 高 学 生 一 教师 比 的 学 校 中 只 有 成 绩 最 好 的 学 校 参 加 了 此 项 考试 ,那么 所 
估计 的 班级 规模 效应 将 是 有 偏 的 。 


7.5 城市 的 高 犯罪 率 可 能 会 决定 他 们 需要 更 多 的 警察 保护 和 在 警察 上 的 更 多 的 花费 ， 
但 如 果 警 察 尽职 尽责 ,那么 较 多 的 警察 经 费 支 出 会 减少 犯罪 。 因 此 ,存在 从 犯罪 率 到 警察 经 
竟 支 出 和 从 警察 经 费 支出 到 犯罪 率 的 因果 联系 ,这 样 就 导致 了 联 立 因果 偏差 。 

7.6 ”如果 这 个 回 妇 有 同方 差 误差 ,那么 同方 差 的 和 异 方差 的 标准 误 一 般 是 相近 的 , 关 
为 二 者 都 是 一 致 的 。 但 是 ,如 果 误 差 项 是 异 方差 的 ,那么 同方 差 标准 误 就 是 不 一 致 的 ,而 异 
方差 标准 误 是 一 致 的 。 因 而 ,两 个 标准 误 的 不 同 值 构成 了 异 方差 的 证 据 , 这 表明 了 应 该 使 用 
异 方差 标准 误 。 
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8.1 面板 数据 (也 称 纵向 数据 ) 是 指 ”个 不 同 的 实体 在 了 个 不 同 的 时 期 观测 色 的 数 
据 。 一 个 下 角 标 i 表示 实体 ,而 男 一 个 下 角 标 :表示 时 期 。 

82 一 个 人 的 能 力 或 动机 角 可 能 影响 其 教育 ,也 可 能 影响 其 收入 。 能 力 较 强 的 个 人 倾 
向 于 完成 较 多 年 的 教育 ,而 且 对 给 定 的 教育 水 平 而 言 ,他 们 倾向 于 有 较 高 的 收入 。 这 同样 也 
适用 于 有 动机 的 人 。 宏 观 经 济 状况 也 是 一 个 影响 收 和 人 和 教育 的 随时 间 而 变化 的 变量 。 在 经 
济 训 退 期 间 ,失业 率 高 ,收入 低 , 大 学 人 学 率 增 加 。 因 人 而 异 和 因 时 间 而 异 的 国定 效应 可 以 
被 包含 在 回归 中 ,以 控制 因 人 而 异 和 因 册 间 而 异 的 变量 。 

8.3 当 因 人 而 异 的 固定 效应 被 包含 在 回归 模型 中 时 ,他 们 捕捉 到 了 在 样本 时 期 不 发 生 
变化 的 个 体 的 全 部 特征 。 由 于 性 别 在 样本 暑期 不 发 生变 化 ,因此 , 它 对 收入 的 效应 不 能 通过 
从 因 人 而 异 的 圈定 效应 中 分 开 来 确定 。 同 样 ,时 间 固 定 效应 捕 提 到 了 在 个 体 之 间 不 发 生变 
化 的 时 期 的 全部 特征 。 全 国 失 业 率 水 平 在 给 定 的 时 点 上 对 样本 中 所 有 的 个 体 而 言 是 相同 
的 ,因而 它 对 收入 的 效应 不 能 通过 从 因 时 间 而 异 的 固定 效应 中 分 开 来 确定 。 
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9.1 由 于 了 是 二 元 变量 ,因此 它 的 预测 值 是 Y= ! 的 概率 。 这 个 概率 必须 在 0 各 1 之 
间 , 所 以 概率 值 1. 3 是 没有 意义 的 。 

9.2 第 (1) 列 中 的 结果 是 针对 线性 概率 模型 的 。 线 性 概率 模型 中 的 系数 表示 ,* 的 单 
位 变化 对 Y=1 的 概率 的 影响 。 第 (2) 列 和 第 (3) 列 中 的 结果 是 针对 logit 模型 和 probit 模型 
的 ,这 些 系 数 很 难 解 释 。 要 计算 logt 模型 和 probit 模型 中 了 的 单位 变化 对 了 =1 的 概率 的 影 
响 , 需 使 用 重要 概念 9.2 中 提出 的 方法 和 步 又 。 

9.3 ”她 应 该 使 用 logit 模型 或 probit 模型 。 这 些 模型 要 好 于 线性 概率 模型 ,因为 它们 将 
回归 的 预测 值 限制 在 0 和 1 之 间 。 通 常 ,probit 和 logit 回归 会 给 出 相似 的 结果 ,因此 ,她 应 
该 使 用 她 的 软件 易于 执行 的 方法 。 

9.4 不 能 使 用 OLS ,因为 该 问 归 函 数 不 是 回归 系数 的 线性 函数 (这 些 系 数 出 现在 非 线 
性 消 数 中 或 的 内 部 )。 极 大 似 然 估计 量 是 有 效 的 ,能 够 处 理 参数 是 非 线 性 的 回归 函数 。 


第 10 章 


10.1 回归 误差 4 的 增加 使 需求 曲线 向 外 移动 ,导致 价格 和 数量 都 增加 ,因而 m(P” ) 
与 误差 项 是 正 相关 的 。 由 于 这 个 正 的 相关 性 ,8, 的 OLS 估计 量 是 不 一 致 的 ,并 且 可 能 比 
的 真实 值 大 。 

10. 2 ”这 个 州 的 人 均 树 木 数量 是 外 生 的 ,因为 它 与 各 求 函数 中 的 误差 项 可 以 被 认为 是 
不 相 美 的 。 然 而 ,因为 它 也 可 能 与 nP )} 不 相关 ,所 以 它 并 不 是 相关 的 。 一 个 有 效 的 








工具 变量 必须 是 外 生 的 屿 是 相关 的 ,所 以 这 个 州 的 人 均 树 木 数量 不 是 一 个 有 效 的 工具 变量 -。 

10.3 可 以 论证 ,律师 的 数量 与 监禁 率 是 相关 的 ,所 以 它 是 相关 的 ( 尽管 这 应 该 用 10.3 
节 中 的 方法 来 检查 ) 。 然 而 ,因为 具有 高 于 预期 犯罪 率 的 州 (具有 正 的 回 妇 误差 ) 可 能 有 较 
多 的 律师 ( 罪犯 必须 被 辩护 或 起 诉 ) ,所 以 ,律师 的 数量 将 与 回归 谋 差 正 相 关 。 这 意味 着 律 
师 的 数量 不 是 外 生 的 。-~ 个 有 效 的 工具 变量 必须 是 外 生 的 且 是 相关 的 ,所 以 律师 的 数量 不 
是 一 个 有 效 的 工具 变 基 。 

10.4 如果 焉 离 的 差 是 一 个 有 效 的 工具 变量 ,那么 它 一 定 与 在 相 关 。 在 这 个 例子 中 ,区 
是 一 个 表示 病人 是 否 接 受 心 脏 导 管 插入 术 的 二 元 变量 。 工 具 变 量 的 相关 性 可 以 用 10.3 节 
中 总 结 的 方法 和 步 又 来 检验 。 检 查 工 具 变 量 的 外 生性 更 为 腰 难 。 如 果 存 在 比 内 生 回归 因子 
更 多 的 工具 变量 ,那么 工具 变量 的 联合 外 生性 可 用 重要 概念 10.6 中 总 结 的 了 检验 来 检验 。 
但 是 ,如 果 工 具 变量 的 数量 等 于 内 生 回 归 因 子 的 数量 ,那么 不 可 能 从 统计 上 检验 外 生性 。 在 
McClellan , McNeil 和 Newhouse 的 研究 (1994) 中 ,存在 一 个 内 生 回 归 因 子 ( 治疗 ) 和 一 个 工具 
变 重 (距离 之 差 ) ,所 以 不 能 使 用 了 检验 。 评 估 这 个 外 生性 需要 使 用 专家 判断 。 


第 11 章 


11.1 最 好 随机 地 将 处 理 水 平分 配 到 每 个 地 块 中 。 该 问题 中 所 列 出 的 研究 计划 可 能 有 
缺陷 ,因为 不 同 的 地 块 组 可 能 系统 地 不 同 。 例 如 ,前 25 块 地 可 能 比 其 他 地 块 有 更 差 的 排水 
设备 ,这 会 导致 较 低 的 作物 产量 。 问 题 中 所 列 出 的 处 理 分 号 将 这 25 块 地 放 在 控制 组 中 ， 
而 过 麻 地 估计 了 施肥 对 农作物 产量 的 因果 效应 ,这 个 问题 可 以 用 处 理 的 随 桃 分 配 来 避免 。 

11.2 处理 效应 可 被 估计 为 处 理 组 和 非 处 理 组 (控制 组 ) 的 平均 胆固醇 水 平 之 差 。 利 
用 公式 (11,2) 中 所 显示 的 具有 额外 回归 因子 的 盖 分 估计 量 , 每 位 病人 的 体重 .年 龄 和 性 别 
的 数据 训 被 用 来 改进 这 个 估计 值 。 这 个 回归 可 能 会 生成 一 个 更 精确 的 估计 值 ,因为 它 控制 
了 这 些 可 能 会 影 啊 胆固醇 的 额外 因素 。 如 果 你 有 在 进 人 实验 之 前 每 位 病人 的 胆固醇 水 平 数 
据 , 那 么 可 以 使 用 差分 再 差分 估计 量 。 这 个 估计 量 控 制 了 那些 在 样本 期 间 保 持 不 变 的 胆 男 
醇 水 平 的 因 个 体 而 异 的 决定 性 因素 ,如 该 人 的 导致 高 胆固醇 的 遗传 因 吾 。 

11.3 如果 转 到 小 班 的 学 生 系统 地 不 同 于 其 他 的 学 生 , 那 么 内 部 有 效 性 就 被 打折 扣 了 。 
例如 ,如 果 转 学 的 学 生 倾向 于 有 较 高 的 收 人 ,并 且 在 校外 有 较 多 的 学 习 机 会 ,那么 他 们 倾向 
于 在 标准 化 考试 中 表现 得 更 好 。 该 实验 会 错误 地 将 这 个 成 绩 归功 于 较 小 的 班级 规模 。 最 
初 ,随机 分 配 的 信息 可 以 像 公式 (11.5) 那 样 被 用 做 回归 中 的 工具 变量 ,来 恢复 内 部 有 效 性 。 
初始 的 随机 分 配 是 个 有 效 的 工具 变量 ,因为 它 是 外 生 的 (与 回归 误差 项 无 关 ) ,并 县 是 相关 
的 (与 实际 分 配 相关 )。 : 

11.4 Hawthorne 效应 不 可 能 是 施肥 例子 中 的 问题 ,除非 (例如 ) 工 人 是 否认 真 地 耕种 
不 同 的 地 块 取 决 于 处 理 。 胆 固 醇 实验 中 的 病人 可 能 比 不 在 该 实验 中 的 病人 更 勒 于 辽 药 ,使 
得 胆固醇 实验 成 为 双方 不 知情 的 ,所 以 医生 和 病人 部 不 知道 病 入 是 在 接受 处 理 还 是 在 接受 
安慰 剂 ,这 会 降低 实验 效应 。 在 像 STAR 这 样 的 实验 中 ,如 果 教 师 感觉 到 该 实验 给 他 们 提供 
了 一 个 证 明 小 班 是 最 好 的 这 样 的 机 会 ,那么 实验 效应 可 能 是 重要 的 。 

11.5 ”地震 在 班级 规模 中 引 人 了 随机 性 ,这 使 得 处 理 看 上 去 仿佛 是 被 随机 分 配 的 。 
10, 1 节 中 的 讨论 描述 了 工具 变量 回归 如 何 利 用 这 个 引致 的 班级 规模 的 变化 来 估计 班级 规 
模 对 考试 分 数 的 效应 ， 





B FDD, + BFDD,, +B,FDD, ,+ +B,FDD, s+ E(u, (FDD, ,FDD,, FDD, e)a M FDD 
是 严 外 生 的 时 ,E(u 1FDD,, ,FDD,, FDD, 0) =0, 因 此 ,FDD,, ,不 进入 这 个 辕 归 方程 中 。 
当 FDD, 是 外 生 的 但 不 是 吧 寻 生 的 时 , 它 可 能 是 E(u, FDD, ,FDD, ,FDD,,…) 关 0 的 情 
况 , 因 此 ,FDD,,, 将 会 进入 到 该 回归 方程 中 。 


第 14 章 


14.1 这 和 位 宏观 经 济 学 家 想 要 构造 9 个 变 基 的 预测 。 如 果 在 VAR 中 使 用 每 个 变 盘 的 
四 阶 滞后 ,那么 每 个 VAR 方程 中 将 包含 37 个 回归 系数 (常数 项 和 9 个 变量 中 每 个 变量 4 个 
系数 ) 。 样 本 期 间 包 含 128 个 季度 观测 值 。 当 用 这 128 个 观测 值 估计 37 个 系数 时 ,所 估计 
的 系数 可 能 是 不 精确 的 ,这 导致 不 准确 的 预测 。 一 种 可 供 选 择 的 方法 是 对 每 个 变量 使 用 单 
变量 自 回 归 。 这 个 方法 的 优势 是 可 以 估计 相对 较 少 的 参数 ,因此 ,系数 将 会 被 OLS 精确 地 
估计 ; 侠 陷 是 该 预测 只 利用 了 被 预测 变量 的 沾 后 值 ,而 其 他 变量 的 谐 后 值 也 可 能 包含 额外 的 
有 有 几 的 预测 信息 。 一 种 折 中 方法 是 ,使 用 一 组 含 额外 预测 因子 的 时 间 序 列 回归 ,例如 ,可 能 
使 用 GDP ,消费 和 长 期 利率 的 灌 后 设 定 GDP 的 预测 回归 方程 ,但 排除 了 其 他 的 变量 。 可 以 
使 用 短期 利率 ,长 期 利率 ,GDP 和 通货 膨胀 率 的 请 后 设 定 短期 和 率 预测 回归 方程 ,基本 思路 
是 ,在 每 个 回归 方程 中 包含 最 重要 的 预测 因子 ,省略 不 是 非常 重要 的 变量 。 

14.2 Y ATHE Ya =0.7 x5 =2.45,Y,. I PJ MAE Y, a, = 0.72 x5 = 
0. 0001。 结 果 是 合理 的 ,因为 该 过 程 是 适度 序列 相关 的 (8, =0.7) ,那么 了 ,ao 与 到 只 是 弱 相 
美的 ,这 意味 着 了,» 的 预测 值 应 该 非常 驶 近 于 jx , 即 了 的 均值 。 既 然 该 过 程 是 平稳 的 ,并 且 
Bo =0, 那 么 Hr =0, EE, MRM F Y a EA EEF 0, 

14.3 如果 了 和 CC 是 协 整 的 ,那么 误差 收 正 项 Y-C 也 是 平稳 的 。 序 列 Y~C 的 图 形 应 
该 表现 出 平稳 性 。 序 列 Y- C 的 协 整 检验 可 以 使 用 近 基 一 富 勒 或 DF-GLS 单位 根 检 验 来 完 
成 。 这 是 协 整 系数 为 已 知 条 件 下 检验 协 整 的 一 个 例子 。 

14.4 Hu REAA a, 也 会 很 大 。 由 于 og; Ru, 的 条 件 方差 ,因此 ,u 可 能 也 很 
大 ,这 将 会 导致 一 个 大 的 oi,, 值 , 依 此 类 推 。 

14.5 ” 当 零 假设 是 假 的 时 ,一 个 功效 强大 的 检验 更 有 可 能 拒绝 该 零 假 设 。 这 提高 了 你 
区 分 单位 AR 根 和 小 于 1 的 根 的 能 力 。 


第 15 章 


15.1 如果 重 要 概念 15. 1 中 的 假设 4 是 真 的 ,那么 在 大 样本 条 件 下 ,用 蜡 方差 稳健 的 
标准 误 构造 的 一 个 5 名 的 置信 区 间 将 会 以 95%% 的 概率 包含 p, 的 真实 值 。 如 果 重 要 概念 
15. 1 中 的 假设 4 是 假 的 ,那么 同方 差 惟一 的 方差 估计 量 是 不 一 致 的 。 到 此 一 般 而 言 ,在 大 
样本 条 件 下 ,如 果 误 差 是 异 方差 的 ,那么 用 同方 差 惟一 的 标准 误 构 造 的 一 个 95% lJ BH X 
间 不 会 以 把 名 的 概率 包含 及 的 真实 值 , 所 以 这 个 置信 区 间 不 是 渐 近 有 效 的 。 

15.2 根据 Slutsky 定理 ,4,8, 服从 渐 近 的 N(0,9) 分 布 。 因 此 ,Pr(4.5. <2) 约 等 于 
Pr[ Z < (2/3) ] ,这 里 Z 是 标准 正 态 随机 变量 。 计 算 这 个 概率 得 到 Pr[Z < (2/3) ] =0. 75。 

15.3 WFX <10 的 值 ,这 些 点 应 该 非常 接近 于 该 条 回 妇 直线 ,因为 u, 的 方差 很 小 。 
4 X > 10 时 ,这 些 点 应 该 离 该 条 回归 直线 非常 远 ,因为 太 的 方差 很 大 。 由 于 下 所 10 的 这 些 
点 更 接近 于 回归 直线 ,因此 WS 给 予 它们 更 大 的 权重 。 

15.4 ”高 斯 一 马尔 可 去 定理 隐 含 着 被 平均 的 估计 量 不 可 能 比 WLS 好 。 为 了 理解 这 一 
点 ,注意 被 平均 的 估计 量 是 了 ,… Y, 的 一 个 线性 函数 (OLS 估计 量 是 线性 函数 ,因此 它们 的 





均 信 也 是 线性 图 数 ?并 且 是 无 偏 的 4OLS 佑 计量 是 无 偏 的 ,因此 它们 的 均值 也 是 无 偏 的 ) 。 
高 斯 一 马尔 可 夫 定 理 隐 含 着 WLS 是 最 佳 的 线性 条 件 无 偏 们 计量 ,人 此 ,被 平均 的 佑 计量 不 
可 能 比 WLS 好 。 


第 16 章 


16, 1 天 的 第 一 列 的 每 一 个 元 素 都 为 1, 第 二 列 积 第 二 列 中 的 元 素 都 是 0 积 1。 ERX 
的 第 一 列 是 第 二 列 与 第 三 列 的 和 ,因此 这 些 列 是 线性 依赖 关系 ,下 不 具有 满 秩 。 通 过 剔除 
KR 全, 来 重新 设 定 这 个 回归 。 

16.2 a 用 OLS 估计 这 些 回归 系数 ,并 计算 异 方差 稳健 的 标准 误 。 将 置信 区 间 构 造 为 
A. +1.96SE(6. ), 


b. 用 OLS 估计 这 些 回 妇 系数 , 并 计算 异 方差 稳健 的 标准 误 。 将 置信 区 间 构 造 为 记 + 
1.96SE( 房 ) 。 另 一 种 可 供 选 择 的 方法 是 ,计算 同方 差 惟一 的 标准 误 喇 ( 房 ) ,将 置信 区 间 构 


造 为 Bi +1.96 SE(A,), 
o 该 置信 区 间 可 以 按 (b) 的 方式 来 构造 ,它们 用 到 了 大 样本 正 态 通 近 。 在 假设 1~6 都 


为 真 的 条 件 下 , 这 个 精确 的 分 布 可 被 用 来 构造 置信 区 间 记 二 kaa s SË (Â, ) ,其 中 
tk1094 是 自由 上 央 为 hn- 上 -I 的 1 分布 的 第 97.5 个 百 分 位 数 ,这 里 n=500,5 =1。 附 表 2 
的 一 个 扩展 形式 显示 了 basa ms =1. 9648。 

16.3 不 成 立 ,这 个 结果 要 求 有 正 态 分 布 误差 。 

16.4 这 里 的 BLUE 和 估计 量 就 是 CLS 逢 计量。 你 必须 知道 如 以 计算 精确 的 GLS 估计 
量 。 然 而 ,如果 如 是 某 些 参数 的 一 个 己 知 函数 ,而 这 些 参 数 又 可 以 被 一 致 地 估计 出 来 ,那么 
这 些 参数 的 估计 量 可 被 用 来 构造 协 方差 矩阵 全 的 一 个 和 计量 。 于 是 ,这 个 知 计 量 可 被 用 来 
构造 CLS 估计 量 的 一 个 可 行 形式 。 当 样本 容量 很 大 时 ,这 个 估计 量 约 等 于 BLUE 个 计量 。 

16.5 有 许多 例子 ,这 只 是 其 中 的 一 个 。 假 设 忒 =Y... ,wu 是 均值 为 0 B Jr328 o° 独 
立 同 分 布 的 (也 就 是 说 ,这 个 回归 模型 是 第 12 章 中 的 AR(1) 模 型 )。 在 这 种 情况 下 ,对 于 j 
<i X KHT u BEI FSi, X, 则 不 依赖 于 u AERA EIX) =0, Ri, E(u, . 1X.) 
产 0 ,这 意味 着 ECU IX) =0 。 





teaearessne distributed kg model 自 加 四 分 布 旨 后 模 型 ;将 基 一 时 间 序列 变量 表示 
为 了 滞后 值 和 另 一 变量 X, 法 后 值 的 函数 的 一 个 线性 回归 模型 。 该 模型 表示 为 ADL(p ,gq)， 
其 中 p 表示 了 的 滞后 期 数 ,9 表示 并 的 滞后 期 数 。 

edge causal ffe J 轩 失 下 启 :在 一 个 异 质 总 体 中 ,个 林 因 果 效 应 的 总 体 平均 值 ,也 
称 为 平均 处 理 效 应 。 

balanced panel 蕊 合击 梳 : 一 个 没有 丢失 观测 值 的 丰 板 数据 集 。 在 这 个 数据 集中 , 变 其 
在 每 个 实体 和 每 个 时 期 都 被 观测 到 、 

base specihicatim 其 洗 民 证 :使 用 专家 判断 ,经 济 理论 以 及 数据 是 如 何 被 搜集 上 来 的 知 
识 的 组 合 ,选择 一 组 回归 因子 的 基线 回归 设 定 或 基准 男 妇 设 定 。 

aves mlannatan entenen MIN BPE OA M ARAG EEM, 

Bernoulli distubuhon 开 妈 里 分 布 :一 个 贝 努 里 随机 变量 的 概率 分 布 。 

Bernoulli random variable U SRRA E i RRO 和 1 两 个 值 的 随机 变量 。 

hest hnear unbiased estimator ief ÉRTI 无 俩 舍 计 十 : 指 所 有 那些 与 样本 值 了 为 线性 隐 数 
关系 且 是 无 偏 的 佑 计量 中 方 莽 最 小 的 那个 估计 量 。 在 高 斯 一 马尔 可 夫 条 件 下 ,0LS 佑 计量 
就 是 回归 系数 的 最 佳 线性 无 仿 佑 计量 。 

has 便 关 :一 个 个 计量 与 所 要 估计 的 参数 值 之 差 的 期 望 值 。 如 果 jy 是 jr 的 一 个 估计 
蕙 ,那么 fy 的 偏差 就 是 E(Dy) 一 总 yo 

BIC :请 见 信息 准则 。 

binary variable 元 变 生 ;一 个 或 者 取 1 或 者 取 0 的 变节 。 一 个 二 元 变量 被 用 来 表示 一 
个 二 元 的 结果 。 例 如 ,对 于 一 个 人 的 性 别 来 说 ,如 果 该 人 是 女性 ,那么 X=1; 如 果 该 人 是 男 
性 ,那么 于 =0。 因 此 ,和 就 是 反映 个 人 性 别 的 一 个 二 元 (或 指示 ,或 虚拟 ) 变量 。 

buanale normal dtnbuton “开赴 坊 分 布 :描述 两 个 随机 变量 联合 分 布 的 正 态 分 布 的 一 
个 推广 形式 。 

BLLE; 请 见 最 佳 线 性 无 偏 估 计量 。 

break date 窒 空 日 期 : 指 总 体 时 间 序 列 回归 系数 的 一 个 离散 变化 的 日 期 。 

causal effect 因果 效应 :在 一 个 理想 化 随机 控制 实验 中 所 测度 的 一 个 给 定 干预 或 处 理 所 
产生 的 期 望 效 应 。 

central lima theorem 中 心 补 限定 理 ; 数 理 统计 中 的 一 个 结果 。 该 定理 指出 ,在 一 般 条 件 
下 , 当 样 本 规模 很 大 时 ,标准 化 的 样本 平均 数 的 抽样 分 布 吾 被 一 个 标准 正 态 分 布 很 好 地 
JBL. 

¿hi-squared distribution KAAI Y 分 布 )}:m TAEAE aA fl 
Shio ER m 被 称 为 卡 方 分 布 的 自由 度 。 

Chow tes 邹 检 验 ; 已 知 突变 日 期 时 ,对 时 间 序 列 回 归 中 的 突变 进行 检验 的 一 种 方法 。 

coettulent of detenumalun YERA ALR 。 

cointegration 协 整 ; 指 两 个 或 两 个 以 上 时 间 序 列 变 基 拥有 一 个 共同 的 随机 趋势 。 

comen trend 车 起 韧 ;由 两 个 或 更 多 个 时 间 序 列 变量 所 共同 拥有 的 趋势 。 

condinonal distribution 条 件 分 布 :一 个 随机 变量 在 已 知 另 一 个 随机 变量 取 茶 一 特定 值 条 


件 下 的 概率 分 布 。 
Conditional wxpeetalaon 条 件 期 鸟 一 个 随机 变量 在 已 知 另 一 个 随机 变量 取 某 一 特定 值 条 
件 下 的 期 望 值 。 


conditional heleroskedasticaty 条 和 三民 方 基 ;通常 指 依 赖 于 其 他 变量 的 一 个 误差 项 的 方差 。 








condinonal mean 条件 均值 :一 个 条 件 分 布 的 均值 。 请 见 条 件 期 望 。 

condihonal mean independen e 287] 28 ph u 此 :给 定 回 归 因 子 条 件 下 ,回归 误差 项 的 
条 件 期 望 依赖 于 回归 因子 中 的 一 部 分 而 不 是 全 部 。 

conditional vavanee 条 入 太 和 关 : 即 某 一 条 件 分 布 的 方 盖 。 

econfidenee mtejival (or conlidence set) 置信 区 间 ( 或 置信 集 ) ; 按 事 先 设 定 的 概率 在 重复 
样本 间 计 算 时 ,包含 总 体 贿 数 真实 值 的 一 个 区 间 ( 或 集合 ) 。 

confidence Inel 置 入水 平 :一 个 置信 区 间 ( 或 置信 和 集 ) 包 会所 估计 参数 真实 值 的 一 个 事 
先 设 定 的 概率 。 

rossen -H : 指 一 个 估计 量 有 是 一致 的 。 请 见 一 致 佑 计量 。 

ceonsistenl estunalor “人 钱 佑 计 切 : 依 概 率 收 和 伍 到 所 估计 前 参数 的 估计 量 。 

continuous random variable 连 统 随机 变 下 ;一 个 能 取 连 续 值 的 随机 变量 。 

control group 控制 组 :在 一 项 实验 中 ,没有 接受 处 理 或 干预 的 组 。 

control vanable 控制 变 基 :回归 因子 的 另外 一 个 术语 ,具体 地 讲 , 指 能 够 控制 那些 决定 
变量 变化 的 因素 之 一 的 回归 因子 。 

convergence In distribution 依 分 布 收 伍 : 当 一 个 分 布 序列 收 伍 到 一 个 极限 时 。15. 2 节 中 
给 出 了 精确 的 定义 。 

convergence In probabli 依 概 净 收 伐 ; 当 一 个 随机 变量 序列 收 化 到 某 一 特定 的 值 时 。 
例如 , 随 着 样本 规模 的 增 大 ,样本 平均 值 变 得 越 来 越 趋 近 于 总 体 平 均值 。 请 见 重要 概念 2.6 
和 和 15.2 节 。 

correlation 相关 性 ;两 个 随机 变量 一 起 移动 或 变化 的 程度 的 一 个 无 量 网 测量 指标 。 X 和 
Y 之 闻 的 相关 性 (或 相关 系数 ) 是 Or Orar RRN cor( X,V) 。 

correlation coefficient 相关 系数 ;请 见 相 关 性 。 

covariance 协 闻 共 ; 两 个 随机 变量 一 起 变化 的 程度 的 一 个 测量 指标 。X 和 了 之 间 的 协 方 
差 是 期 望 值 EL (XX-pjgx){ 了 -pr)] ,用 cov X,Y) oyy 表 示 。 

covariance matrix B) Jy 2E TE : 由 随机 变量 向 量 的 方差 和 协 方差 构成 的 矩阵 。 

critical value 临界 值 ,一 个 检验 统计 量 的 值 ,在 这 个 值 上 ,给 定 显著 性 水 平 下 该 检验 正好 
拒绝 了 零 假 设 。 

cross-sectional dala 鹤 向 数据 ,所 搜集 的 不 同 实体 在 单个 时 期 的 数据 。 

cubie regression model 次 回归 模型 ;将 工 ,下 和 时 作为 回归 因子 的 一 个 非 线性 回归 
函数 。 

cumulative distribution function (e. d, 【累积 分 布 图 数 ;请 见 累 积 概率 分 布 。 

cumulative dyname multipher 累积 动态 乘 数 ( 或 累积 动态 乘 子 . 译 者 注 ): 时 间 序 列 变量 
世 的 单位 变化 对 了 的 累积 效应 。 期 累积 动态 乘 数 就 是 的 单位 变化 对 Y +Y, +… 
+ 了 ,4 的 效应 。 

cumulative probability distribution 累积 概率 分 布 .反映 一 个 随机 变量 小 于 或 等 于 某 一 给 
定 值 这 个 概率 的 一 个 函数 。 

dependent variable 因 变 基 :在 回归 模型 或 其 他 统计 模型 中 待 解释 的 变量 。 该 变量 出 现 
在 回归 模型 的 左边 。 

deterministic trend 全 定性 趋势 :一 个 变量 随时 间 的 推移 所 表现 出 的 一 种 持续 的 ,长 期 的 
运动 , 它 可 被 表示 为 一 个 时 间 的 非 随机 函数 。 

Dickey-Fuller test jH 基 一 窗 勒 检验 ;在 一 阶 自 回 归 (AR(1)) 中 检验 单位 根 的 一 种 方法 。 








中 fferenee esttmalor X 分 向 计 是 ;构造 为 处 理 组 和 控制 组 的 样本 平均 结果 之 差 的 一 个 因 
果 效 应 估计 量 。 

dferenee-in-dllereate csumnalnt X Arape AFf H 丢 ; 在 处 理 组 中 了 的 平均 变化 减 去 控制 
组 中 了 的 平均 变化 。 

hseiete random varahle 亢 散 随机 僧 量 :一 个 取 离 散 值 的 随机 变量 。 

distributed lag model APATTA W: MAATE X WEEE eGo m EEL SU, 

dummy variable PERLA (IEE ia RAHO AORAR., 

dinamice raual efed 动态 因果 效应 ;一 个 变量 对 另 一 个 变量 的 当前 值 和 未 来 值 的 因果 
效应 。 

daamic multiplier HAEA ea Aie yf DR Bl) h 期 动态 乘 数 就 是 时 间 序 列 变量 X, 
的 单 们 变化 对 了 ,的 效应 。 

eudogenous vanable 内 和 半空 涡 : 一 个 与 误差 项 相关 的 变量 。 

errors-in-varlable hias Thi 误差 偏差 ;在 回 妇 因子 中 因 测 量 误 差 所 引起 的 一 个 个 妇 系数 
估计 量 的 偏 莽 。 

error term 识 六 项 :了 和 总 体 回 归 函 数 之 差 ,在 本 书 中 用 表示。 

estimate 人 入 计 和 值 :根据 一 个 特定 样本 中 的 数据 所 计算 的 一 个 估计 量 的 数值 。 

estimator 佑 计量: 需要 从 一 个 总 体 中 随机 抽取 的 一 个 样 本 数据 的 函数 。 一 个 估计 量 就 
是 使 用 样本 数据 计算 总 体 参 数值 (如 总 体 均 值 ) 的 一 个 合理 猜测 值 的 步 驴 。 

cxacl dhstribution 精确 分 布 : 一 个 随机 变量 的 精确 概率 分 布 。 

exact rientificalon 符 好 识别 ; 当 工 具 变 量 数 等 于 内 生 回 归 因 子 数 时 。 

exogenous variable F 变 研 :一 个 与 回归 误差 项 不 相关 的 变量 。 

expeeted value 期 望 值 ; 一 个 随机 变量 在 许多 次 重复 的 实验 中 或 事 忻 中 发 生 的 长 期 平均 
值 。 它 是 该 随机 变量 所 具有 的 所 有 可 能 取 值 的 概率 加 权 平均 。 了 的 期 望 什 用 E( 站 表示 ,也 
称 为 了 的 期 望 。 

experimental data 实验 数据 :从 一 项 实验 中 裴 得 的 数据 ,该 项 实验 可 能 是 用 来 评估 一 项 
处 理 , 或 评估 一 项 政策 ,或 调查 一 个 因果 效应 。 

experimental effect 实验 效应 : 当 实 验 的 主体 由 于 他 们 是 实验 的 一 部 分 而 改变 他 们 的 行 
为 时 。 

explaned sum of squares ( ESS) 解释 的 半 方 利 ;了 的 预测 值 f, 与 其 平均 值 离 差 的 平方 
和 。 请 见方 程 (4. 35) 。 

explanatory variable 解释 空 包 :请 钢 回 归 因 子 。 

external validity 外 部 有 效 性 :如 果 从 一 项 统计 研究 的 总 体 和 环境 中 所 得 出 的 推断 和 结 
论 ,能 够 被 推广 到 其 他 的 总 体 和 环境 中 ,那么 该 统计 研究 的 推断 和 结论 就 是 外 部 有 效 的 。 

Fiansbue 下 续 计 若 : 用 来 对 两 个 或 两 个 以 上 回归 系数 的 联合 假设 进行 检验 的 统计 量 。 

F, a -dstibuation F, ,分 布 :具有 m 个 自由 度 的 卡 方 分 布 被 m 来 除 这 样 一 个 随机 变量 的 
分 布 。 

feasible GLS 品行 的 GES: 它 是 广义 最 小 二 乘 (CLS) 估计 量 的 一 种 形式 ， 它 使 用 了 不 同 
观测 值 的 回归 残 差 之 间 条 件 协 方 差 的 一 个 估计 是 。 

ieasible WIS 可 行 的 中 LS; 加 权 最 小 二 乘法 (WLS) 估 计 革 的 一 种 形式 。 它 使 用 了 回归 
误差 项 的 条 件 方差 的 一 个 估计 车 。 

first difference - 阶 关 分 :一 个 时 间 序 列 变量 Y, 的 一 阶 差分 是 Y, - Y,_, ;用 AY, 表示 。 




















ineluded endogenous variables 内 含 内 竺 变 基 :与 误 蔷 项 相关 的 回归 因子 (通常 在 工具 变 
HEF), 

meluded exogenous variables 内 含 是 生变 伟 ; 与 误差 项 不 相关 的 铝 归 因子 {通常 在 工具 变 
METH), 

independence J vy 性 ;当知 道 一 个 随机 变量 的 值 不 能 提供 关于 另 一 个 随机 变量 的 值 的 
信息 时 ,如 果 两 个 随机 变量 的 联合 分 布 是 它们 的 边缘 分 布 的 积 , 那 么 这 两 个 随机 变量 是 独 
YRI 

Indiator vanable J8 12 h 18 hk CF, 

information criterion fa BL fh Ee B AR T yE ha St Siri, AE EE 
禄 归 中 应 该 包含 的 滞后 变量 的 个 数 的 统计 量 。 主 要 的 例子 是 赤字 信息 准则 {AIC ) 和 贝 叶 斯 
信息 准则 ( BIC)。 

instrument ] 县: 请 见 工 具 变量 。 

Instrumental variable 上 只 变量 :一 个 与 内 生 右 归 困 子 相关 (工具 变量 相关 性 ) 但 与 回归 
误差 项 不 相关 { 工具 变量 外 生性 ) 的 变量 。 

inslrumental variable (IV) regression Diii p: 4 [BI IN f X SRAN u 相关 时 ， 
348 SL Tk a] qP83kra K HIS 326-3S EEA E. 

mieraction term 2 E fE Hii ; Aa F98 18] BJ Bris Rh — AAAF, j hn, 
X, x X, ° 

intercept QB RTE BIRR h 8, 的 值 。 

miernal validity 内 部 有 效 性 ;在 一 项 统计 研究 中 , 当 关 于 因果 效应 的 推断 对 所 研究 的 总 
体 有 效 时 。 

joint hypothesis 联合 假设 :由 两 个 或 两 个 以 上 单个 假设 所 构成 的 假设 ,也 就 是 说 ,对 模型 
的 参数 有 一 个 以 上 的 约束 。 

Joint probability distibunon 联合 概 举 分 布 :决定 两 个 或 两 个 以 上 随机 变量 结果 的 概率 的 
概率 分 布 。 

lags 湾 后 值 ; 一 个 时 间 序 列 变量 在 前 一 时 期 的 值 。7, 的 第 了 个 滞后 值 是 了 o 

law of Herated expectations 囚 期 望 法 则 :概率 论 中 的 一 个 结论 , 即 了 的 期 望 值 等 于 给 定 
条 件 下 了 的 条 件 期 望 的 期 望 值 , 即 ECY) = ELECYIX)]。 

law of large numbers 人 数 定律 :根据 概率 论 中 的 这 个 结论 ,在 一 般 条 件 下 , 当 样 本 规模 很 
大 时 样本 平均 数 将 以 很 高 的 概率 接近 于 总 体 均 值 。 

leasl squares assumptions 最 小 一 乘 假设 :重要 概念 4. 3( 单 个 变量 回归 ) 和 重要 概念 5.4 
(多 元 回归 模型 ) 中 所 列 出 的 线性 向 归 模 型 假设 。 

least squares estimator 最 小 二 乘 估计 基 :使 残 差 平方 和 最 小 的 那个 估计 量 。 

limited dependent vanable 爱 限 岗 变 量 ; 只 能 取 有 限 值 的 因 变 量 。 例 如 ,变量 可 能 是 只 取 
0 ~1 的 二 元 变量 ,或 附录 9 3 中 所 描述 的 任何 一 个 模型 中 出 现 的 变量 。 

jinear-log model 线性 对 数 异 型 :一 个 非 线 性 回归 函数 ,在 这 个 函数 中 , 因 变 量 是 了 , 自 变 
HE). 

linear regression function 绥 性 辐 归 函数 :具有 常数 斜率 的 回归 函数 。 

Jinear probability model EER KA), Y 是 二 元 变量 的 回归 模型 。 

logarithm 对 数 :为 正 的 变 景 所 定义 的 一 个 数学 函数 。 它 的 斜率 总 是 正 的 ,但 是 趋向 于 
0。 自 然 对 数 是 指数 函数 的 反 函 数 , 即 三 =In(e )。 





q 





logii regression logit 国 厢 (或 称 对 数 单 位 |, 译 省 注 ) ;一 个 二 元 因 变 量 的 非 线 性 回归 
模型 ,其 中 总 体 回 归 函 数 是 使 用 累积 logistic 分 布 消 数 建立 的 。 

log-linear model 对 和 效 线性 模型 ;一 个 非 线 性 回归 函数 ,其 中 国 变量 是 n(Y), B EE 
EX, 

log-log model 4 af Aki T; — F dE2k PE PI O 8 38, H R E I (Y), AEH 
Æ ln( X), 

longaudinal dala ZA i] gie: AERA E 

long-run cumulative dynamie mullipher KH ZEZA IA ok KHH MaA ET, t: 8 
i) :时 间 序 列 变 量 工 的 变化 对 了 的 累积 长 期 效应 。 

marginal probability dhatribution 边缘 概率 分 布 :一 个 随机 变量 了 的 概率 分 布 的 另 一 个 名 
称 , 它 将 了 的 单独 的 分 布 { 边 缘分 布 ) 同 了 和 另 一 随机 变量 的 联合 分 布 区 别 开 来 。 

masimu likelihood wbmate (MLE) 极 大 似 然 估 计 基 ;通过 使 似 然 函 数 最 大 化 所 得 到 的 
未 知 参数 的 一 个 估计 量 。 请 见 附录 9. 2。 

mean 均值 :一 个 瑚 机 变量 的 期 望 值 。 了 的 均值 用 Ar 表示 。 

moments of a distribution 分 布 的 征 : 一 个 随机 变 基 不 同 次 寡 的 期 望 值 。 随 机 变量 了 第 r 
PEE E(Y'), 

mujtteolhneumty 多 香 闪 线性 :请 见 完全 多 重 共 线性 和 不 完全 多 重 共 线 性 。 

multiple regiession model 多 元 回归 模 型 :单个 变量 回归 模型 的 一 个 扩展 , 它 允 许 工 依赖 
于 下 个 回归 因子 。 

natural expenmenl 自然 实验 ;请 见 准 实验 。 

natural logarithm 月 然 对 数 : 请 网 对 数 。 

95% confidence set 95 久 的 置信 和 集 : 具 有 5 名 的 置信 水 平 的 置信 和 集 。 请 见 置信 区 间 。 

nonlinear least squares 非 线 忻 最 小 二 玫 : 当 回归 国 数 是 未 知 参数 的 一 个 非 线性 男 数 时 所 
适用 的 类 似 于 OLS 的 一 种 方法 。 

nonlinea: regression function 非 线 性 回归 明 数 ;斜率 不 是 常数 的 回归 画 数 。 

nonvtatonary 非 平 稳 的 : 当 一 个 时 间 序 列 变量 及 其 滞后 值 的 联合 分 布 随时 间 的 变化 而 变 
化 时 。 

normal distribution 中 . 仿 分 布 :连续 随机 变量 最 常用 的 一 种 类 似 于 钟 形 的 分 布 。 

null hypethest 零 假设 ;在 假设 检验 中 被 检验 的 假设 ,通常 用 H, 表示 。 

observatonal data 观测 数据 : 它 是 基于 对 一 项 实验 环境 之 外 的 实际 行为 进行 观测 或 测量 
的 数据 。 

observation number 观测 斯 数 :在 一 个 数据 集中 ,分 配给 每 个 实体 的 惟一 的 标识 符号 - 

OLS estimator OLS 佑 计 基 :请 多 善 通 最 小 二 乘 估 计量 。 

OLS regression line OLS 四 归 线 :用 OLS 估计 量 代替 总 体系 数 的 回归 直线 。 

OLS resdual OLS 382: Y, 和 OLS MBR ZZ, BPH i, 表示 。 

omtled variables bias ARTERE: — AERE y HAREAK, HR EA 
ETH. RRE E E A iR T MA ETER. 

one-sided alternative hypothesis 单 边 备 择 假设 :所 研究 的 参数 在 零 假设 所 给 出 的 值 的 
一 边 。 

order of integration 单 整 阶 数 :为 了 使 一 个 时 间 序 列 变量 空 得 平稳 ,必须 对 该 时 间 序 列 变 
量 进 行 差分 的 次 数 。 一 个 p 阶 单 整 的 时 间 序 列 变量 必须 进行 p 次 差分 ,用 O) RR. 


ordinary least squares estimator 38 Be |x .水仙 计 居 :使 残 差 平方 和 最 小 的 回归 截 距 和 
斜率 的 估计 重 。 

overidentifieahon 过 度 识 别 ; 当 工具 变量 数 超过 内 含 内 生 回 归 因 于 数 时 。 

p-value p 但 ;假设 零 很 设 是 正确 的 ,抽取 一 个 至 少 与 实际 所 计算 的 统计 量 一 样 对 零 假 设 
是 不 利 的 统计 量 的 概率 。,p 值 也 被 称 为 边缘 显著 性 慨 率 ,是 零 假设 可 能 被 拒绝 的 最 小 的 显 
AKF. 

panel data 面板 数据 ;多 个 实体 在 多 个 时 期 被 观测 的 数据 。 

parameter 参数 :决定 一 个 概率 分 布 戌 一 个 总 体 同 归 函 数 特性 的 常数 。 

partia] eomphanee 偏 信 顿 柱 : 在 一 项 随机 化 实验 中 , 当 一 些 参 与 者 没有 遵守 处 理 协 议 时 
就 发 生 了 偏 依 赖 性 。 

partial effect 局 部 效应 :在 保持 其 他 回归 因子 不 变 的 条 件 王 ,变化 加 与 因子 中 的 一 个 回 
归 因 子 对 了 的 效应 。 

perfect multicollinearn 完全 多 重 共 线性 : 当 .- 个 回归 因子 是 其 他 回归 因子 的 线性 邯 数 
时 ,就 发 咎 了 完全 多 重 共 线 性 。 

polynomial regression model 多 项 式 癌 归 模 型 ;将 五 ,天 ,…,X' 作为 回归 因子 的 一 个 非 线 
ERNIA R H r 是 整数 。 

population 总 休 ; 所 研究 的 全 部 实体 ,如 人 ,公司 或 学 区 等 。 

population coefficients AAAA: ALAARE E, 

population intercept and slope GERRIE FZHR: TEMZE BL BJ Ah 8, REE) FIA, (83 
率 ) 的 真实 值 或 总 体 值 。 在 多 元 回归 中 ,有 多 个 斜率 系数 (B ,B;,… B.) ,每 个 倍率 系数 对 应 
着 一 个 回归 因子 。 

population multiple regression model 总 体 多 元 回归 模型 ,重要 概念 和 .2 中 的 多 元 回归 
模型 。 

population regression lme 总 体 思 | 归 线 :在 - 一 个 单 变 基 的 回归 中 ,总 体 回归 线 居 BB + X; 
在 一 个 多 元 回归 中 ,总 体 回归 线 是 B +A Xn +BX +: +B,X,.. 

power 坊 效 : 当 备 择 假 设 为 真 时 ,一 个 检验 正确 地 拒绝 零 假 设 的 梳 率 。 

predicted value 预测 值 :由 OLS 屿 归 线 所 预测 的 世 的 值 ,本 书 中 用 f, 表示 。 

price elasticily 价格 弹性 :价格 每 增加 1 名 所 引起 的 需求 量 的 百分比 变化 。 

probability W£: 一 个 结果 或 一 个 事件 从 长 期 来 看 将 要 发 生 的 次 数 的 比重 。 

probability density function (p. d, f.) 概率 密度 函数 ;对 一 个 连续 随机 变量 阐 言 ,概率 密 
度 函 数 下 尾 何 两 点 间 的 面积 就 是 该 泽 机 变量 落 在 这 两 点 间 的 概率 。 

probability distribution 概 头 分 布 :对 一 个 离散 型 随机 变量 而 言 ,该 随机 变量 亡 能 取 的 所 
有 值 的 列表 以 及 每 个 值 所 对 应 的 概率 。 | 

probit regression Prebit [s] Ji ( 或 称 概率 单位 回归 , 译 者 注 ) : 它 是 二 死因 变量 的 一 个 非 线 
性 回归 模型 ,在 这 个 模型 中 ,使 用 际 积 标准 正 态 分 布 函数 对 总 体 回归 隙 数 进 行 建 模 。 

program evaluation 项 日 详 估 : 它 是 涉及 估计 一 个 项 目 .一 项 政策 . 某 些 其 他 的 于 预 或 “处 
理 " 的 效应 的 一 个 研究 领域 。 

pseudo out-of-sample forecast 伪 样 本 外 预测 : 它 是 对 部 分 样本 煞 据 值 进行 计算 的 预测 , 它 
使 用 看 上 去 这 些 样本 数据 仿佛 还 没有 实现 的 方法 。 

quadratie regression model 二 次 回归 模型 :以 到 和 X° 作为 回归 因子 的 一 个 非 线性 同 归 
函数 。 
































ciuaviexpermmenl 洽 实 验 : 它 是 指 随机 性 是 由 个 体 环 境 的 变化 所 引信 的 一 种 实验 环境 ， 
因此 着 上 去 处 理 仿佛 是 被 随机 分 配 的 。 

F LC AT 机 , 因 变 量 的 样本 方差 被 回归 因子 所 解释 的 部 分 。 

FE 调整 的 拟 合 优 鼎 :请 见 调整 的 让 。 

randomized iw d experiment BG ELE HA: CEA, sk Wk h 2 1 
被 随机 地 分 配 到 没有 接受 处 理 的 控制 组 ,或 被 随机 地 分 配 到 接受 处 理 的 处 理 组 中 。 

random walk 随机 游 动 : 它 是 一 个 时 间 序 列 过 程 , 在 这 个 过 程 中 ,变量 的 值 等 于 它 的 前 期 
值 加 上 一 个 不 可 预测 的 误差 项 。 

random walk with drit 带 潭 黎 珊 前 随机 游 动 :随机 游 动 的 一 个 通 式 , 在 这 个 通 式 中 ,变量 
中 的 变化 具有 一 个 非 零 均 值 ,但 却 是 不 可 预测 的 。 

regressand WIJI ARIMR T a AATE o 

regression spevification 回归 设 定 :对 回归 的 一 种 描述 ,包括 对 所 使 用 的 回归 因子 及 任何 
非 线性 变换 的 说 明 。 

regressor 回归 疯子 :出 现在 回归 方程 右边 的 变量 ,也 册 回 归 中 的 自 变量 。 

rejection region 拒绝 域 :一 个 检验 统计 量 的 值 的 集合 ,在 这 个 集合 中 该 检验 措 绝 零 假 设 。 

repeated eros=-seclional data 重复 的 截面 数据 ;截面 数据 集 的 一 个 汇总 ,其 中 ,每 个 截面 
数据 集 对 应 着 一 个 不 同 的 时 期 。 

restricted regression 有 约束 的 回归 ;为 满足 某 些 条 件 , 回 归 系 数 被 施加 了 约束 的 一 种 回 
归 。 仿 如 , 当 计 算 经 验 规 则 下 统计 量 时 ,这 就 是 含有 约束 系数 以 满足 零 假设 的 回归 。 

rool mean squared forecast error $ A AR PANI RE, MAREEA R, 

rule-of-thumb F-statistie 经 验 规 则 下 统计 基 : 在 有 约束 和 没有 约束 的 回归 中 ,使 用 残 差 平 
方 和 计算 的 严 统 计量 。 当 回归 误差 是 同方 差 的 时 ,适合 使 用 经 验 规则 五 统计 量 。 

sample correlation 样本 相关 性 ;两 个 随机 变量 之 间 相 关 性 的 一 个 估计 量 。 

sample covariance 样本 起 方 差 :两 个 随机 变量 之 间 协 方差 的 一 个 估计 量 。 

sample selection bias 样本 选择 偏差 ; 当 一 个 选择 过 程 影 响 数据 的 可 获得 性 ,而 且 该 过 程 
与 因 变 重 相 关 时 ,所 出 现 的 回归 系数 估计 量 的 偏差 。 

sample standard deviation 样本 标准 差 :随机 变量 标准 差 的 一 个 估计 量 。 

sample variance 样本 方差 :随机 变量 方差 的 一 个 佑 计量。 

sampling dhstmbution 抽样 分 布 : 一 个 统计 量 在 所 有 可 能 样本 中 的 分 布 ， 即 从 局 一 总体 中 
使 用 一 个 随机 抽取 的 样本 序列 重复 地 评价 该 统计 量 所 产生 的 分 布 。 

seatterplot 散 点 图 :由 X, AY, 的 个 观测 值 所 组 成 的 图 形 ,其 中 每 个 观测 值 用 点 (X,， 
YER, 

serial correlation 序列 相关 性 :请 见 自 相关 。 

serjally uncorrelated 序列 不 相关 的 :所 有 自 相关 系数 都 等 子 零 的 时 间 序 列 变量 。 

significance level 显 获 性 水 平 : 罕 一 个 统计 假设 检验 中 ,一 个 事先 设 定 的 当 零 假设 为 真 
时 的 拒绝 概率 。 

simple random sampling 简单 随机 抽样 :确保 每 个 实体 等 可 能 地 被 选中 ,用 这 种 方法 从 总 
体 中 随机 地 选择 实体 。 

simultaneous causality bias 联 立 因 朵 偏 益 : 除 了 从 开 到 了 有 我 们 所 感 兴趣 的 因果 关系 外 ， 
从 Y 到 愉 也 存在 相应 的 因果 关系 。 联 立 困 果 关系 使 在 与 所 研究 总 体 回归 中 的 误差 项 相关 。 

simultaneous equation bias RX V Jy Pte :请 见 联 立 因果 偏差 。 


unbalanced panel 非 均衡 面板 :缺失 一 些 数 据 的 面板 数据 集 . 

unbiased estimator 无 偏 佑 让 茎 :偏差 等 于 零 的 估计 芋 、 

uncorrelated 洒 相 关 的 :如 巢 两 个 随机 宏 避 的 相关 关系 是 过 ,那么 它们 是 不 相关 的 

underidentificanon 不 是 识别 : 当 工 黄 变 基数 小 于 内 生 同 归 因 子 数 时 。 

unit root 单位 恨 : 指 最 大 的 根 等 于 1 的 自 回 归 ， 

unreslricted regression 无 约 来 的 回归 : 当 计 算 经 验 规 则 FF 统计 量 时 ,这 是 备 择 假 设 下 所 
应 用 的 回归 ,因此 ,没有 对 系数 加 以 约束 以 满足 零 假设 。 

VAR: 请 见 向 盟 和 白 问 归 。 

variance 方差 :一 个 随机 变量 与 其 均值 之 差 的 平方 的 期 望 值 ,7 的 方差 用 ot 表示 。 

vector autoregression 向 其 自问 由 :出 五 个 方程 所 构成 的 个 时 间 序 列 变 其 的 模型 ,每 个 
方程 对 应 着 一 个 变 基 。 其 中 ,所 有 方程 的 回归 因子 是 所 有 变 基 的 浪 后 值 。 

volatiliy clustering ESER; 当 一 个 时 间 序 列 变 其 在 一 些 时 期 显示 出 一 些 高 集 聂 的 方 
差 , 面 在 另 一 些 时 期 显示 出 一 些 低 集聚 的 方差 叶 。 

weak instruments 弱 丁 其 变量 :与 内 和 牛 回 则 因子 有 低 相 关 关 系 的 工具 变量 ， 

weighted least squares ( WLS) 加 权 最 小 二 恢 ; 当 问 归 误差 是 异 方差 的 ,以 及 异 方差 的 形 
式 是 已 知 的 或 能 被 佑 计时 ,可 使 用 的 一 种 替代 OLS 的 方法 。 
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